我们正在超越爬虫和基础网页自动化

Reddit r/singularity 2026/05/17 15:00 新闻

browser-automation web-scraping ai-agents computer-vision llms open-source

摘要

对网页自动化快速演变的反思，强调像 Skyvern 这样的模型如何结合计算机视觉和 LLM 来克服传统爬虫的挑战。

浏览器领域的发展速度真是太疯狂了（从20到25年前到现在，真是一段漫长的旅程，哈哈）。还记得以前只要网站有任何动态加载，基本的网页爬取都很麻烦，但现在我们已经达到了模型可以像人类一样浏览网页的程度。昨天我在 GitHub 上翻了翻一些开源项目，看到了 Skyvern 的仓库，很酷的是他们如何将计算机视觉与 LLM 结合起来解决“选择器失效”的问题。你们觉得我们最终会有一个单一的“网络代理”完全取代浏览器，还是我们始终需要某种专门的工具来帮助我们跨越 AI 与传统网站之间的鸿沟？

查看原文

我们正在超越爬虫和基础网页自动化

相似文章

自动化的未来将是：截图->思考->响应->截图

@Fluyeporlaweb: 网页抓取技术升级——Scrapling 绕过 Cloudflare 封锁，速度是 BeautifulSoup 的 774 倍，而且无需……

D4Vinci/Scrapling

@RoundtableSpace: 网页抓取已死。PixelRAG 完全跳过 HTML 解析。它截取页面截图，视觉模型直接读取答案…

@heynavtoor：虚拟助手行业已经落幕。苏黎世联邦理工学院的两名学生仅用四天就推出了一个最小可行产品（MVP）。如今，AI 控制了他们的 C…

提交意见反馈