因为他们都能够从这个声音之中听出文字转WAV音频