@heynavtoor:虚拟助手行业已经落幕。苏黎世联邦理工学院的两名学生仅用四天就推出了一个最小可行产品(MVP)。如今,AI 控制了他们的 C…
摘要
Browser-Use 是由苏黎世联邦理工学院(ETH Zurich)学生开发的一个开源框架,旨在通过人工智能实现浏览器自动化。它提供了一种免费且具备自愈能力的解决方案,能够模拟人类交互,而无需依赖易碎的 HTML 解析技术,从而对传统的 RPA(机器人流程自动化)行业构成挑战。
查看缓存全文
缓存时间: 2026/05/11 04:36
虚拟助手行业已经终结。苏黎世联邦理工学院(ETH Zurich)的两名学生仅用四天就推出了一款最小可行产品(MVP)。现在,AI 控制着他们的 Chrome 浏览器。点击、输入、滚动、预订航班、填写 CRM、抓取潜在客户、提交申请——所有这些都在他们睡觉时完成。无需 Selenium,无需 UiPath 许可证,无需外包的虚拟助手,也无需 Zapier 的配置。数据令人震惊:→ 菲律宾虚拟助手:每小时 8 到 12 美元 → 美国虚拟助手:每小时 25 到 50 美元 → UiPath 企业许可证:每年 20,000 到 100,000 美元 → Browser-Use:0 美元。MIT 许可。可在你的笔记本电脑上运行。这项技术非常惊人:它不解析 HTML。它不编写那些在网站重新设计时立即失效的 CSS 选择器。它以你阅读页面的方式读取页面。截图输入,动作输出。AI 看到搜索框,输入城市。看到日期选择器,点击 5 月 15 日。网站明天重新设计。一切正常运行。商业机会更加惊人:Manus AI 基于 Browser-Use 构建。2026 年筹集资金的一半 AI 代理层也基于此。自由职业者向当地房地产经纪人、招聘人员和潜在客户生成机构提供浏览器自动化服务,每个工作流收费 500 到 5,000 美元。一名开发者加一个周末就等于一门生意。创始人是 Magnus Müller 和 Gregor Žunič。两位来自苏黎世联邦理工学院的工程师。Y Combinator W25 批次。他们于 2024 年 10 月开源了该项目。3 个月内获得了 40,000 颗星。Felicis 在 2025 年 3 月领投了他们的 1700 万美元种子轮融资。Paul Graham 支持了这一轮。他们在旧金山运营着一支 7 人团队。以下是它的功能:→ 使用单个英语提示词驱动任何网站 → 兼容 GPT-5、Claude、Gemini、DeepSeek、Llama 及任何 LLM → 持久登录会话,无验证码墙,无双重认证循环 → 无头模式或观看其工作模式 → 单提示词实现多标签页、多步骤工作流 → 操作失败时自我纠正 → 60 秒内 pip 安装 → 免费的托管云 http://browser-use.com 或在你自己的笔记本电脑上运行最惊人的部分是:创建 Manus AI 框架的公司将框架公开。MIT 许可。永远免费。分叉它。运行它。在其上销售自动化服务。今日数据:93,144 颗星。10,546 个分叉。315 位贡献者。123 次发布。v0.12.6 于 2026 年 4 月发布。自 2024 年 10 月起构建。MIT 许可。价值 140 亿美元的流程自动化(RPA)行业每年向企业收取六位数费用。来自苏黎世联邦理工学院的两位工程师将相同的能力赋予了任何拥有笔记本电脑的人。你的表单。你的标签页。你的工作流。无订阅费。免费且开源。(链接在评论中)
Browser Use - AI 使用互联网的方式
来源:https://browser-use.com/ 我们推出了 Browser Use Desktop:一种全新的浏览器体验,完全开源。查看一下 👀 (https://github.com/browser-use/desktop-app?utm_source=browser_use_website)大规模代理。不可检测的浏览器。适用于任何网站的 API。
开始使用 (https://cloud.browser-use.com/)
Browser Harness 开源、轻量、自愈的框架。赋予你的代理完成网上任何任务的超能力。 (https://browser-harness.com/)### Stealth Browsers 反检测,验证码解决,195+ 国家/地区的代理。零配置。 (https://browser-use.com/stealth-browsers)### Browser Use Box 你的 24/7 Claude 代理。远程框中的 Claude Code 和 Browser Harness。通过 Telegram、网页或 SSH 驱动它。 (https://browser-use.com/bux)### Web Agents 提取、自动化、测试和监控——使用自然语言。 (https://browser-use.com/web-agents)### Custom Models 专为浏览器自动化设计的 LLMs。 (https://browser-use.com/custom-models)### Proxies 覆盖 195+ 国家/地区的住宅 IP。轮换,未检测到。 (https://browser-use.com/proxies)
相似文章
@nikunj: 老兄,/goal 就是 AGI,如果有合适的工具的话…… 你说什么?你遍历了整个包含两千多个条目的数据库……
一位用户描述了一个AI代理,它自主修复了数据库中的产品图片、前端错误和描述,使用了浏览器自动化和网络搜索,并在用户与创始人会面的两小时内运行,突显了令人印象深刻的类似AGI的能力。
超越炒作:我刚刚看到一个AI代理在18分钟内自动完成了原本需要4小时的研究工作流程。
作者描述了观察一个AI代理自主完成竞争情报工作流程的过程,该流程通常需要4小时,而它在18分钟内完成,突出了它浏览网站、处理PDF和迭代搜索的能力,暗示着从简单聊天机器人向自主执行的转变。
@svpino: 我还没见过在浏览器中运行的智能体不让人觉得是取巧之作。我试过无头浏览器,但无法…
Santiago (@svpino) 讨论了在浏览器中运行AI智能体的挑战,而 @ego_agent 宣布了 'ego lite',一个内核级重建,旨在让AI智能体更快、更可靠。
@rohanpaul_ai: 机器人技术进展缓慢,因为每次更改都需要物理设置、人员、空间以及反复的实地运行。物理AI需要...
Antioch 推出了 Antioch Agent,这是一个基于浏览器的机器人模拟器,让开发者可以在没有物理硬件的情况下,在封闭的智能体循环中测试机器人软件,从而加速开发周期。
@browser_use: 这个代理是一个AI UGC创业公司
一家AI初创公司构建了一个代理,可以读取任何互联网内容,并自动创建和上传病毒式传播的TikTok视频,全天候在VPS上运行。