最终成了两种族群文字转WAV音频