第三次就是正常文字转WAV音频