所以他们才要互相商议文字转WAV音频