从最开始的四人分别对面而坐文字转WAV音频