这是他的预判文字转WAV音频