他们期望解脱文字转WAV音频