最麻烦的是他们的想法文字转WAV音频