但是他能判断出文字转WAV音频