而是直接切入到正在行进的剧情中的文字转WAV音频