只能根据所经过的地方和大致的环境来判断了文字转WAV音频