所以托尼才会考虑重新拍摄之前的几段镜头文字转WAV音频