演员很可能在演绎的时候就用了同一种方式文字转WAV音频