随着两个人刚才的说话文字转WAV音频