也进行了一些配合训练文字转WAV音频