已经将周围的观众自动忽略文字转WAV音频