其实妆容部分都是和服装文字转WAV音频