最终她还是接受了文字转WAV音频