然后将各种数据反馈回去文字转WAV音频