但是这个人形的比例是成人的比例文字转WAV音频