因为他们也辨认出来文字转WAV音频