就判断出了它的在场文字转WAV音频