前面的两个人在负责注意周围的情况文字转WAV音频