还需要熟悉一下那里的环境文字转WAV音频