他无法把现在的场景和之前的场景做一下对比文字转WAV音频