就是用在系统中的智能核心文字转WAV音频