在人群缓慢离场时文字转WAV音频