虽然外表几乎和我们一样文字转WAV音频