再从房间内的所有人这里采集一次信息文字转WAV音频