从而精确的捕捉高速移动的目标文字转WAV音频