主要是用来归类和评测x能力的品阶文字转WAV音频