他已经能够猜测到了一二文字转WAV音频