总之就是重色轻诺文字转WAV音频