因为他们都能意识到文字转WAV音频