因为根据它的了解文字转WAV音频