一开始他们还很担心文字转WAV音频