反而都是将目光文字转WAV音频