因为他几乎可以断定文字转WAV音频