他们事先也知道文字转WAV音频