每一组是一个国家的十个人组成文字转WAV音频