因为此际他感应到的结果是文字转WAV音频