他们两个原本是想要原路返回文字转WAV音频