然后在全场的人的目光中文字转WAV音频