就是当前的环境状况文字转WAV音频