主要是种族和强弱的划分……文字转WAV音频