是按每个人出来的名次计算的文字转WAV音频