因为他根本就无法确定文字转WAV音频