所以他几乎能够确定文字转WAV音频