所以他们几乎可以确定文字转WAV音频