标签
Browse.sh 是一个数百个浏览器 Skill 的开源目录,通过一条 CLI 命令即可让 AI Agent 获得新的互联网能力,覆盖找房、航班、电影、工作等场景。
一位开发者列出了其Hermes多智能体系统中使用最频繁的5个MCP技能,涵盖Cloudflare基础设施、通过Porkbun进行域名管理、预测市场交易、Twitter数据提取以及网页抓取。
Scrapling 是一个网页抓取框架,能够绕过 Cloudflare 封锁,速度比 BeautifulSoup 快 774 倍,并能自动适应网站变化。它在 GitHub 上拥有 5.22 万星标,并支持作为 MCP 服务器与 AI 代理协作。
了解如何设置并在本地使用 Common Crawl 数据进行网页数据处理任务。
谷歌计划在2026年用代理式AI彻底改造搜索,使用户能通过搜索查询生成自定义UI应用,例如旅行行程。该功能由Gemini 3.5驱动,代表了从蓝色链接到AI生成内容的转变,具有个性化、可共享迷你应用的潜力。
Browserbase 推出了 browse.sh,这是一个开源 CLI 工具,提供预构建的技能目录,帮助 AI 代理自动化各种网站,降低 token 成本。
对网页自动化快速演变的反思,强调像 Skyvern 这样的模型如何结合计算机视觉和 LLM 来克服传统爬虫的挑战。
一位用户描述了一个AI代理,它自主修复了数据库中的产品图片、前端错误和描述,使用了浏览器自动化和网络搜索,并在用户与创始人会面的两小时内运行,突显了令人印象深刻的类似AGI的能力。
AIDesigner MCP v2 使 AI 编码代理能够对任何网站的用户界面进行逆向工程,提取品牌、资源与组件,自动重建完整的设计系统,从而实现对精英 SaaS 界面的快速克隆与重新设计。
文章强调了AI Agent悄无声息地爬取网站的普遍现象,并介绍了Vouched的检测系统。该系统由KYA-OS身份层驱动,通过可验证凭据和简单的提示词集成,来识别代理、机器人和人类流量。
CatchAll by NewsCatcher 是一款基于用户自定义条件从网络构建定制化数据集的产品。
精选的Hermes AI智能体顶级集成列表,包括Firecrawl、Browserbase、Google Workspace、Reddit、YouTube、Discord、GitHub、Stripe、Bland/Twilio、Apify、Readwise、Granola/Fathom和Obsidian,为智能体赋予网页搜索、交互、效率和研究方面的超能力。
本文介绍了 CloakBrowser,这是一款基于 Chromium 的开源隐秘浏览器,旨在绕过 reCAPTCHA 和 Cloudflare Turnstile 等机器人检测系统。它声称通过直接修补 C++ 源代码而非注入 JavaScript 来提供卓越的隐秘能力,定位自己为昂贵商业反检测浏览器的免费替代方案。
介绍了一个名为 ai-website-cloner-template 的工具,它利用 AI 将任意网站逆向工程为高质量的 Next.js 代码库,支持主流 AI 编程助手。
作者分析了 RSS 源因抓取和干扰而衰退的问题,认为现代 Feed 阅读器必须整合替代的聚合方式才能保持相关性。
一位开发者使用 Rust 构建了名为 Obscura 的开源无头浏览器引擎,专为 AI Agent、网页爬取和自动化设计,声称其比 Chrome 更加轻量。
CloakBrowser 是一个开源浏览器项目,直接改自 Chromium C++ 源码,通过在编译阶段更改 57 个指纹信息来绕过 Cloudflare 等反爬检测。
作者介绍了 TextWeb,这是一个开源工具,它将网页渲染为 Markdown 格式供 LLM 处理,而非使用昂贵的大视觉模型,该工具支持命令行界面 (CLI) 和 MCP 服务器。
Browser-Use 是由苏黎世联邦理工学院(ETH Zurich)学生开发的一个开源框架,旨在通过人工智能实现浏览器自动化。它提供了一种免费且具备自愈能力的解决方案,能够模拟人类交互,而无需依赖易碎的 HTML 解析技术,从而对传统的 RPA(机器人流程自动化)行业构成挑战。