标签
browser-search 是一个开源、自托管的工具集,包含三款工具(SearXNG、Camofox、CloakBrowser),让AI助手无需API密钥或订阅即可搜索和浏览网页,并具备自动导航升级和深度研究能力。
作者将其基于Rust的浏览器自动化工具开源,该工具包含基础设施和部署功能,原本是一项业务,现免费用于AI代理开发。
agent-browser is a CLI tool for browser automation designed for AI agents, using compact text output and ref-based element selection to minimize token usage. The post also highlights three other tools—portless, emulate, and ai-cli—for improving agent loop efficiency.
Puppeteer 是一个流行的浏览器自动化 JavaScript 库,支持控制 Chrome 和 Firefox,可用于网页抓取、自动化测试等场景,最近还集成了 MCP 协议以支持 AI 代理直接操控浏览器。
本文推荐了Codex的几个插件,包括computer use和browser,用于制作个人网站并部署到GitHub和Vercel,强调其便捷性。
browser_use宣布已登顶Browser Arena排行榜。
本文介绍了claude-browser-stack和agent-pods,这是一套自动化浏览器开发循环的工具,通过让AI代理调试API、扫描漏洞、记录用户流程并向Claude提供视觉上下文,从而在编码和验证之间形成闭环。
Lightpanda Agent 和 PandaScript 通过在构建阶段使用 LLM 将普通英语转化为可执行脚本,实现了浏览器自动化,消除了运行时调用 LLM 以及对 Playwright 或 Puppeteer 的依赖。
一位开发者开源了 patchright-cli,这是一个轻量级 CLI,使用 Patchright 让 AI 代理能够操控真实的 Google Chrome 浏览器,旨在避免在网站上被检测。
分享了一个包含16个Codex实战案例的案例库,覆盖PPT生成、MCP、浏览器自动化、知识库等功能,并提供截图和步骤指南。
OpenAI 在 Codex 中增加了对 Chrome DevTools 协议的支持,使其 AI 编程代理能够检查和修改实时网站。该功能为可选启用、早期阶段,目前仅在欧洲经济区、英国和瑞士以外的地区可用。
browser_use展示了他们的v4 AI代理如何自主玩在线游戏powerline.io:通过分析游戏状态并创建实时子代理来争夺第一名。
Maka 是一个本地优先的桌面 AI 工作台,通过 DAG 工作流实现长程执行,集成浏览器自动化与插件能力,现已开源在 GitHub 上。
作者分享了大量使用小米MiMo v2.5 Pro大语言模型进行智能浏览器自动化和全栈开发的经验,强调其成本效益(80%+缓存命中率)和处理长上下文任务的能力,同时指出它需要结构化提示。
Claude Fable 5 通过自主调试 UI 错误,利用浏览器自动化和 Python 脚本创建测试页面并截图,展示了持续主动性。
Browser Use 推出了 Fetch Use,这是一个 Python SDK,用于通过隐身浏览器抓取网站,自动处理代理、Cookie 和会话。
本文介绍了5个开源工具(Agent-reach、Scrapling、Browser-use、Claude in Chrome、Web-access),让Claude Code等AI Agent具备网页数据抓取、浏览器操作等能力,从轻量到重量级覆盖不同场景,并提供配置心法。
Claude Fable 5 现已在 Browser Use Terminal 中可用;它花费了 $7.21 尝试寻找口香糖的优惠码。
Kimi Work 是一个桌面AI代理,可以在本地并行运行300个代理,具备浏览器自动化和定时任务功能,旨在提升独立知识工作者和机构的生产力。