因为他们必须把所有注意力都集中在接下来的戏份里文字转WAV音频