而是因为他已经预料到了文字转WAV音频