顶层的虚拟视频装置投下了一个虚拟图像文字转WAV音频