知道一部分结果的时候他就已经猜测到了文字转WAV音频