他们看起来就像普通人文字转WAV音频