然后快速的从周围人群划过文字转WAV音频