他学习的是晶铠框架的构造文字转WAV音频