确切的说两个人是等待上面的回应文字转WAV音频