不断猜测推断文字转WAV音频