跟他的判断很接近文字转WAV音频