就是小型空间依附的真实世界文字转WAV音频