因为在它设定的初始数据中文字转WAV音频