我们都是根据分类来摆放的文字转WAV音频