因为他们目光能捕捉到的文字转WAV音频