因为他在注意听周围的情况文字转WAV音频