所以还是要先了解一下周围的环境文字转WAV音频