再结合对方刚才说的文字转WAV音频