这也就是她受过的训练在前文字转WAV音频