但是根据周围环境等其他综合分析结果文字转WAV音频