然后他听见自己回答文字转WAV音频