因为他可以确定文字转WAV音频