以前他们还可以勉强支撑文字转WAV音频