就是他能猜测得到的文字转WAV音频