所以他的回答简单粗暴文字转WAV音频