估计是他们自己的人文字转WAV音频