反而是用一个侧面的方式进行了回应文字转WAV音频