基本上是按实力分配的文字转WAV音频