同时也在询问每一个在场的人文字转WAV音频