然后他也是用轻微的动作回答着文字转WAV音频