每个队伍都算是平衡文字转WAV音频