将这些画面全部在脑子里面过滤文字转WAV音频