他们要利用这有限的几百人文字转WAV音频