他有足够的根据确定文字转WAV音频