我们观察了一下环境文字转WAV音频