@heynavtoor:虚拟助手行业已经落幕。苏黎世联邦理工学院的两名学生仅用四天就推出了一个最小可行产品(MVP)。如今,AI 控制了他们的 C…

X AI KOLs Timeline 工具

摘要

Browser-Use 是由苏黎世联邦理工学院(ETH Zurich)学生开发的一个开源框架,旨在通过人工智能实现浏览器自动化。它提供了一种免费且具备自愈能力的解决方案,能够模拟人类交互,而无需依赖易碎的 HTML 解析技术,从而对传统的 RPA(机器人流程自动化)行业构成挑战。

虚拟助手行业已成过去。苏黎世联邦理工学院(ETH Zurich)的两名学生仅在四天内便推出了最小可行产品(MVP)。如今,AI 能够操控他们的 Chrome 浏览器。点击、输入、滚动、预订航班、填充 CRM、抓取潜在客户线索、提交申请——这一切都在他们安睡时自动完成。无需 Selenium,无需 UiPath 授权,无需外包虚拟助手,也无需 Zapier 的繁琐配置。 这些数据令人瞠目结舌: → 菲律宾虚拟助手:每小时 8 至 12 美元 → 美国虚拟助手:每小时 25 至 50 美元 → UiPath 企业版授权:每年 2 万至 10 万美元 → Browser-Use:0 美元。采用 MIT 开源协议。可直接在笔记本上运行。 其背后的科学原理同样令人惊叹:它不解析 HTML,也不编写那些一旦网站改版就会失效的 CSS 选择器。它像人一样阅读页面。截图输入,动作输出。AI 看到搜索框,便输入城市;看到日期选择器,便点击 5 月 15 日。即便网站明天改版,也不会影响运行。 其中的商业机会更加狂野:Manus AI 基于 Browser-Use 构建。2026 年正在融资的半数 AI Agent 层公司也是如此。自由职业者正在为当地房地产经纪人、招聘人员和潜在客户开发机构提供浏览器自动化服务,每个工作流收费 500 至 5,000 美元。一名开发者加上一个周末,就是一门生意。 创始人是 Magnus Müller 和 Gregor Žunič。两位来自苏黎世联邦理工学院的工程师。Y Combinator W25 批次成员。他们于 2024 年 10 月开源了该项目。在短短 3 个月内,GitHub 星标数突破 40,000。2025 年 3 月,Felicis 领投了他们的 1700 万美元种子轮融资。Paul Graham 对此表示支持。他们在旧金山运营着一支 7 人的团队。 以下是它的功能亮点: → 只需一条英文提示词即可驱动任何网站 → 兼容 GPT-5、Claude、Gemini、DeepSeek、Llama 及任何其他大语言模型 → 支持持久登录会话,无验证码墙,无双重验证(2FA)死循环 → 支持无头模式或可视运行模式 → 单条提示词即可实现多标签页、多步骤工作流 → 动作失败时自动纠正 → 60 秒内完成 `pip install` → 使用 http://browser-use.com 提供的免费托管云服务,或直接在笔记本电脑上运行 最令人震惊的是:打造 Manus AI 核心框架的公司,将该框架免费公开。MIT 许可证。永久免费。随意分叉。随意运行。在其基础上构建并出售自动化服务。 截至今日的数据: 93,144 个星标。10,546 个分叉。315 名贡献者。123 个发布版本。v0.12.6 版本于 2026 年 4 月发布。自 2024 年 10 月起持续构建。MIT 许可证。 价值 140 亿美元的流程自动化机器人(RPA)行业每年向企业收取六位数的费用。而来自苏黎世联邦理工学院的两位工程师,将同样的能力赋予了任何拥有笔记本电脑的人。你的表单。你的标签页。你的工作流。无需订阅。免费且开源。 (链接在评论区)
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/11 04:36

虚拟助手行业已经终结。苏黎世联邦理工学院(ETH Zurich)的两名学生仅用四天就推出了一款最小可行产品(MVP)。现在,AI 控制着他们的 Chrome 浏览器。点击、输入、滚动、预订航班、填写 CRM、抓取潜在客户、提交申请——所有这些都在他们睡觉时完成。无需 Selenium,无需 UiPath 许可证,无需外包的虚拟助手,也无需 Zapier 的配置。数据令人震惊:→ 菲律宾虚拟助手:每小时 8 到 12 美元 → 美国虚拟助手:每小时 25 到 50 美元 → UiPath 企业许可证:每年 20,000 到 100,000 美元 → Browser-Use:0 美元。MIT 许可。可在你的笔记本电脑上运行。这项技术非常惊人:它不解析 HTML。它不编写那些在网站重新设计时立即失效的 CSS 选择器。它以你阅读页面的方式读取页面。截图输入,动作输出。AI 看到搜索框,输入城市。看到日期选择器,点击 5 月 15 日。网站明天重新设计。一切正常运行。商业机会更加惊人:Manus AI 基于 Browser-Use 构建。2026 年筹集资金的一半 AI 代理层也基于此。自由职业者向当地房地产经纪人、招聘人员和潜在客户生成机构提供浏览器自动化服务,每个工作流收费 500 到 5,000 美元。一名开发者加一个周末就等于一门生意。创始人是 Magnus Müller 和 Gregor Žunič。两位来自苏黎世联邦理工学院的工程师。Y Combinator W25 批次。他们于 2024 年 10 月开源了该项目。3 个月内获得了 40,000 颗星。Felicis 在 2025 年 3 月领投了他们的 1700 万美元种子轮融资。Paul Graham 支持了这一轮。他们在旧金山运营着一支 7 人团队。以下是它的功能:→ 使用单个英语提示词驱动任何网站 → 兼容 GPT-5、Claude、Gemini、DeepSeek、Llama 及任何 LLM → 持久登录会话,无验证码墙,无双重认证循环 → 无头模式或观看其工作模式 → 单提示词实现多标签页、多步骤工作流 → 操作失败时自我纠正 → 60 秒内 pip 安装 → 免费的托管云 http://browser-use.com 或在你自己的笔记本电脑上运行最惊人的部分是:创建 Manus AI 框架的公司将框架公开。MIT 许可。永远免费。分叉它。运行它。在其上销售自动化服务。今日数据:93,144 颗星。10,546 个分叉。315 位贡献者。123 次发布。v0.12.6 于 2026 年 4 月发布。自 2024 年 10 月起构建。MIT 许可。价值 140 亿美元的流程自动化(RPA)行业每年向企业收取六位数费用。来自苏黎世联邦理工学院的两位工程师将相同的能力赋予了任何拥有笔记本电脑的人。你的表单。你的标签页。你的工作流。无订阅费。免费且开源。(链接在评论中)


Browser Use - AI 使用互联网的方式

来源:https://browser-use.com/ 我们推出了 Browser Use Desktop:一种全新的浏览器体验,完全开源。查看一下 👀 (https://github.com/browser-use/desktop-app?utm_source=browser_use_website)大规模代理。不可检测的浏览器。适用于任何网站的 API。

开始使用 (https://cloud.browser-use.com/)

Browser Harness 开源、轻量、自愈的框架。赋予你的代理完成网上任何任务的超能力。 (https://browser-harness.com/)### Stealth Browsers 反检测,验证码解决,195+ 国家/地区的代理。零配置。 (https://browser-use.com/stealth-browsers)### Browser Use Box 你的 24/7 Claude 代理。远程框中的 Claude Code 和 Browser Harness。通过 Telegram、网页或 SSH 驱动它。 (https://browser-use.com/bux)### Web Agents 提取、自动化、测试和监控——使用自然语言。 (https://browser-use.com/web-agents)### Custom Models 专为浏览器自动化设计的 LLMs。 (https://browser-use.com/custom-models)### Proxies 覆盖 195+ 国家/地区的住宅 IP。轮换,未检测到。 (https://browser-use.com/proxies)

相似文章

让 Claude 在浏览器中处理工作

YouTube AI Channels

Anthropic 推出了“Claude for Chrome”,这是一款浏览器扩展程序,使 AI 模型能够自主查看、点击、输入和浏览网页,从而处理复杂的工作流。

个人AI的无头化一切

Simon Willison's Blog

Matt Webb 和 Marc Benioff 等行业领袖预测,将出现面向个人 AI 代理的无头服务转变,API 将取代图形界面成为主要接口。这一趋势可能重塑 SaaS 定价模式,并让 API 优先策略重新成为竞争差异化要素。

@axiaisacat: 字节跳动开源了一个能直接操控你电脑的 AI 叫 UI-TARS,开源免费,本地运行 你用说话的方式告诉它: 「帮我在 Priceline 订9月1日最早的旧金山到纽约的机票」 「帮我把 VS Code 的自动保存延迟设置成500毫秒」 「…

X AI KOLs Timeline

ByteDance has open-sourced UI-TARS, an AI model capable of directly controlling computer interfaces via mouse and keyboard for tasks like booking flights or configuring software. Available in 2B, 7B, and 72B parameter sizes, it runs locally and offers a free alternative to paid services like Anthropic's Computer Use.