它们都会在第一时间捕捉到文字转WAV音频