也可以说他们是排练过的文字转WAV音频