核心数据当然不会提供文字转WAV音频