然后带着它们向前逼近文字转WAV音频