他们同样使用的了文字转WAV音频