然后将周围的环境标注了出来文字转WAV音频