@heynavtoor:虚拟助手行业已经落幕。苏黎世联邦理工学院的两名学生仅用四天就推出了一个最小可行产品(MVP)。如今,AI 控制了他们的 C…
摘要
Browser-Use 是由苏黎世联邦理工学院(ETH Zurich)学生开发的一个开源框架,旨在通过人工智能实现浏览器自动化。它提供了一种免费且具备自愈能力的解决方案,能够模拟人类交互,而无需依赖易碎的 HTML 解析技术,从而对传统的 RPA(机器人流程自动化)行业构成挑战。
查看缓存全文
缓存时间: 2026/05/11 04:36
虚拟助手行业已经终结。苏黎世联邦理工学院(ETH Zurich)的两名学生仅用四天就推出了一款最小可行产品(MVP)。现在,AI 控制着他们的 Chrome 浏览器。点击、输入、滚动、预订航班、填写 CRM、抓取潜在客户、提交申请——所有这些都在他们睡觉时完成。无需 Selenium,无需 UiPath 许可证,无需外包的虚拟助手,也无需 Zapier 的配置。数据令人震惊:→ 菲律宾虚拟助手:每小时 8 到 12 美元 → 美国虚拟助手:每小时 25 到 50 美元 → UiPath 企业许可证:每年 20,000 到 100,000 美元 → Browser-Use:0 美元。MIT 许可。可在你的笔记本电脑上运行。这项技术非常惊人:它不解析 HTML。它不编写那些在网站重新设计时立即失效的 CSS 选择器。它以你阅读页面的方式读取页面。截图输入,动作输出。AI 看到搜索框,输入城市。看到日期选择器,点击 5 月 15 日。网站明天重新设计。一切正常运行。商业机会更加惊人:Manus AI 基于 Browser-Use 构建。2026 年筹集资金的一半 AI 代理层也基于此。自由职业者向当地房地产经纪人、招聘人员和潜在客户生成机构提供浏览器自动化服务,每个工作流收费 500 到 5,000 美元。一名开发者加一个周末就等于一门生意。创始人是 Magnus Müller 和 Gregor Žunič。两位来自苏黎世联邦理工学院的工程师。Y Combinator W25 批次。他们于 2024 年 10 月开源了该项目。3 个月内获得了 40,000 颗星。Felicis 在 2025 年 3 月领投了他们的 1700 万美元种子轮融资。Paul Graham 支持了这一轮。他们在旧金山运营着一支 7 人团队。以下是它的功能:→ 使用单个英语提示词驱动任何网站 → 兼容 GPT-5、Claude、Gemini、DeepSeek、Llama 及任何 LLM → 持久登录会话,无验证码墙,无双重认证循环 → 无头模式或观看其工作模式 → 单提示词实现多标签页、多步骤工作流 → 操作失败时自我纠正 → 60 秒内 pip 安装 → 免费的托管云 http://browser-use.com 或在你自己的笔记本电脑上运行最惊人的部分是:创建 Manus AI 框架的公司将框架公开。MIT 许可。永远免费。分叉它。运行它。在其上销售自动化服务。今日数据:93,144 颗星。10,546 个分叉。315 位贡献者。123 次发布。v0.12.6 于 2026 年 4 月发布。自 2024 年 10 月起构建。MIT 许可。价值 140 亿美元的流程自动化(RPA)行业每年向企业收取六位数费用。来自苏黎世联邦理工学院的两位工程师将相同的能力赋予了任何拥有笔记本电脑的人。你的表单。你的标签页。你的工作流。无订阅费。免费且开源。(链接在评论中)
Browser Use - AI 使用互联网的方式
来源:https://browser-use.com/ 我们推出了 Browser Use Desktop:一种全新的浏览器体验,完全开源。查看一下 👀 (https://github.com/browser-use/desktop-app?utm_source=browser_use_website)大规模代理。不可检测的浏览器。适用于任何网站的 API。
开始使用 (https://cloud.browser-use.com/)
Browser Harness 开源、轻量、自愈的框架。赋予你的代理完成网上任何任务的超能力。 (https://browser-harness.com/)### Stealth Browsers 反检测,验证码解决,195+ 国家/地区的代理。零配置。 (https://browser-use.com/stealth-browsers)### Browser Use Box 你的 24/7 Claude 代理。远程框中的 Claude Code 和 Browser Harness。通过 Telegram、网页或 SSH 驱动它。 (https://browser-use.com/bux)### Web Agents 提取、自动化、测试和监控——使用自然语言。 (https://browser-use.com/web-agents)### Custom Models 专为浏览器自动化设计的 LLMs。 (https://browser-use.com/custom-models)### Proxies 覆盖 195+ 国家/地区的住宅 IP。轮换,未检测到。 (https://browser-use.com/proxies)
相似文章
@svpino:如何自动化网页任务(即使网站没有提供 API)。配合 Claude Code、Cursor、OpenCode、OpenC… 使用
利用 Claude Code、Cursor、OpenCode、OpenClaw 等 AI 编程助手,在没有 API 的网站上实现任务自动化的技巧。
让 Claude 在浏览器中处理工作
Anthropic 推出了“Claude for Chrome”,这是一款浏览器扩展程序,使 AI 模型能够自主查看、点击、输入和浏览网页,从而处理复杂的工作流。
个人AI的无头化一切
Matt Webb 和 Marc Benioff 等行业领袖预测,将出现面向个人 AI 代理的无头服务转变,API 将取代图形界面成为主要接口。这一趋势可能重塑 SaaS 定价模式,并让 API 优先策略重新成为竞争差异化要素。
@axiaisacat: 字节跳动开源了一个能直接操控你电脑的 AI 叫 UI-TARS,开源免费,本地运行 你用说话的方式告诉它: 「帮我在 Priceline 订9月1日最早的旧金山到纽约的机票」 「帮我把 VS Code 的自动保存延迟设置成500毫秒」 「…
ByteDance has open-sourced UI-TARS, an AI model capable of directly controlling computer interfaces via mouse and keyboard for tasks like booking flights or configuring software. Available in 2B, 7B, and 72B parameter sizes, it runs locally and offers a free alternative to paid services like Anthropic's Computer Use.
我构建了 agent-browser,但用于操作系统自动化。
作者介绍了 agent-ctrl,这是一个基于 Rust 的开源 CLI 工具,允许 AI 代理通过辅助功能树与原生应用程序 UI 进行交互,从而实现操作系统自动化。