然后另外一组人就朝着找到的那一组聚集文字转WAV音频