以及他自己的预估文字转WAV音频