结合记忆中再三提到的场景和预言文字转WAV音频