而只是一群会给出应答文字转WAV音频