为什么非要用这等最极端的方式文字转WAV音频