而是按照技能等级来计算文字转WAV音频