也就是说他们的镜头会被剪掉文字转WAV音频