他们从一开始就已经决定了文字转WAV音频