进而把角色塑造出来文字转WAV音频