大多都是按种族和势力在聚集在一起的文字转WAV音频