@ManusAI: https://x.com/ManusAI/status/2052764534872678882
摘要
本文解释了Manus的Browser Operator如何通过在用户授权的本地浏览器会话中运行,使其能够访问超出典型AI搜索能力的订阅和认证内容,并提供了启用和使用它的逐步指南。
查看缓存全文
缓存时间: 2026/05/08 15:34
大多数人跳过浏览器操作员。以下是如何超越表面研究。
让AI为你研究某件事,然后看它碰壁。它调用搜索API,抓取几个公开页面,然后给你一份谷歌决定展示内容的礼貌摘要。而真正能影响决策的信号——那些藏在登录页、仪表盘和你已付费订阅服务背后的信息——典型的聊天机器人根本无法触及。
Manus Browser Operator 弥补了这一差距,但前提是遵循你的规则。未经你明确授权,什么都不会发生。当你开启 My Browser 连接器并授予权限后,Manus 会在你本地的 Chrome 或 Edge 会话中运行,看到你所见的,触及你所能触及的。这一关键转变——从你自己的浏览器环境出发,经你同意后运行——解锁了以前根本不可能实现的整个研究类别。
为什么 Browser Operator 能挖掘更深层信息
有时高价值信息藏在你已付费的订阅服务背后、企业内部系统之中,以及需要认证的门户网站内。这些信息云端都无法触及。一旦你授权 Browser Operator,它就会在你本地浏览器环境中处理每个任务,从而能够在你已使用的网站上执行操作。
同样的能力也延伸到了专业自动化领域。通过 Manus API 可以触发 Browser Operator 来端到端驱动网页操作。这对于那些从未构建过公共 API 的内部公司工具尤其有用,比如旧版 HR 门户、财务系统或政府网站。
穿越长尾网页的指南
除了研究,Browser Operator 已经悄然成为导航网络中最令人困惑角落的向导。比方说,你需要从像 IRIS 这样的政府门户网站深埋三级菜单的角落中提取一份税务文件。Manus 可以一步步点击流程,找出你需要的确切文件。或者想象填写签证申请表:Manus 可以定位正确的模板文档,逐部分填写表格,并标记需要你输入的字段。Manus 不会给你一段泛泛的说明文字,而是实际在你的浏览器中,与你一起点击完成整个过程。
这种可见性至关重要。你可以在任何时候中断并接管,精确看到 Manus 当前在哪个页面,并在任务完成后回溯每一步。如果 Manus 遇到敏感步骤(如支付页面),它会暂停并等待你确认。你始终掌控全局。
随处运行,随时接管
Browser Operator 并不绑定在一台机器上。如果你在工作笔记本上启动一个任务,之后可以在个人设备上继续,从上次中断的地方接续。要实现这一点,请在 Manus 设置中打开 My Browser 连接器,点击配置,然后开启“允许跨浏览器任务”。开启后,Manus 可以驱动任何与你账户关联的已授权浏览器会话——当你在某台机器上认证了供应商门户,但想在实际另一台机器上运行研究时,或者当你想把繁重的自动化任务从主力工作机上移开时,这都很有用。
你还可以从手机触发 Browser Operator。通勤时从 Manus 移动应用发送一个提示,Manus 会在你授权的桌面端启动一个浏览器会话,并在后台运行任务。回到办公桌前,工作已经完成。
首先授权你的浏览器
在要求 Manus 替您浏览之前,您需要授予它使用您本地会话的权限。这只需不到一分钟,并让您完全控制它所能访问的内容。
- 打开你的 Manus 工作区,导航到“连接器”选项卡。
- 开启“My Browser”连接器,并安装 Chrome 或 Edge 的浏览器扩展。
- 开始一个新的提示,要求 Manus 使用你的浏览器。
- 当 Manus 请求接管一个新标签页时,点击“授权”。
让 Browser Operator 发挥作用的三种方式
连接成功后,您可以将通常耗费整个下午的多标签工作流程交给它。以下是使用 Browser Operator 进行研究的三种方式,按从简单提取到完整展示构建的顺序排列。
1. 规划团队出行并填写预订表格
规划即将到来的团队线下活动时,通常需要在一个显示器上打开 Google 地图,同时在另一个显示器上浏览 Booking.com 或 Airbnb。你必须在预算、评价和与特定场地距离之间取得平衡,这意味着无尽的交叉比对。
我把这种分页工作交给 Manus。我提示:“我代表一位同事预订酒店,所以忽略 Booking.com 上可能已预填的任何账户信息,只使用我之后给你的客人详细信息。使用 My Browser 在 Booking.com 上搜索芝加哥市中心 10 月 12 日至 15 日的酒店。筛选 4 星及以上、每晚低于 300 美元的酒店。对于前 3 个结果,使用 Google 地图检查步行到 McCormick Place 会议中心的距离。在聊天中总结前 3 个结果的价格、评分和步行时间,以便我选择一个。”
Manus 打开预订网站,设置我的日期和筛选条件,然后导航到地图验证通勤时间,直接在 Manus 聊天中返回一份清晰的前三名摘要。我选好酒店后,发送后续提示让 Manus 开始预订并填写客人详细信息。它在最后的信用卡屏幕处暂停,让我接管浏览器并自行安全完成支付。
2. 无需标签混乱即可构建采购候选清单
当你需要批量采购设备时,研究阶段通常会耗费大半天时间。你逐一点击零售商列表、避开赞助商广告、将价格复制到电子表格中,并浏览数百条评论,试图在承诺下单前发现耐用性或组装问题。
我将整个研究阶段委托给 Manus。我提示:“我正在为我们的办公室装修采购坐立两用办公桌。使用 My Browser 搜索沃尔玛,跳过赞助商结果,打开前 4 个自然搜索结果。为每个结果提取价格和平均评分,并总结前 3 条关键评论,以便我能在批量订购前标记任何耐用性或组装问题。将所有这些内容整理成一个清晰的可对比表格,我可以将其放入采购简报中。”
Manus 在我的活动浏览器标签中打开零售商,过滤掉赞助商列表,并逐一处理每个产品页面。它利用其原生的 Wide Research 能力阅读每条评论,然后将价格、评分和警示信息整理成一个清晰的可对比表格。我得到了一份可立即做出决策的候选清单,可以直接粘贴到采购简报中,而无需亲自打开任何一个标签。
3. 从你订阅的 Substack 新闻通讯中提取研究简报
我关心的主题最精辟的分析通常藏在我关注的 Substack 新闻通讯中。Lenny 的新闻通讯就是其中之一。存档中充满了关于 AI 代理、货币化和产品策略的文章,我希望从中汲取灵感,但我几乎没有时间坐下来,逐个打开它们,并提取出与我现在正在处理的问题真正相关的内容。
我让 Manus 为我完成研究工作。我提示:“我正在尝试构建一个关于 AI 如何重塑产品货币化和代理策略的视角。使用 My Browser 打开 Substack,进入 Lenny’s Newsletter,查找过去 30 天内发布的最相关文章,完整阅读它们,并提取关键论点。我想要一个 Dashboard(仪表盘),列出最强的断言、每位作者使用的支撑证据,以及文章中出现待解决的问题。”
因为 Manus 运行在我授权的浏览器会话内,它会从我已登录的任何地方开始。如果新闻通讯是我订阅的,Manus 可以像我自己从收件箱点击一样打开完整文章。它从头到尾阅读每篇文章,然后将论点综合成一个清晰的 Dashboard,映射出最强的断言、背后的证据以及值得进一步探讨的问题。我得到了一份关于我所关心主题的研究级简报,从我已经关注的写作内容中汇集而成。
一个有手的代理
真正的人工智能代理不应局限于聊天窗口内。一个有能力的代理需要一个工作环境:一个运行代码的沙盒、一个浏览网页的浏览器,以及连接外部服务的连接器。这些就是代理的“手”。当代理能够使用浏览器时,它就获得了对信息采取行动的能力,而不仅仅是总结信息。
由于 Browser Operator 直接在你的本地浏览器环境中工作,它也尊重你的界限。任何敏感内容都不会离开你的机器,代理只能访问你授权它查看的内容。协作模式建立在透明基础之上:你可以观察它工作、随时中断它,并在遇到敏感步骤(如支付屏幕)时接管。自动化永远不应该是一个黑箱。它应该是一个你足够信任、可以交付实际工作的伙伴,因为你清楚自己始终在掌控之中。
相似文章
@ManusAI: https://x.com/ManusAI/status/2057114674123153541
Manus AI 推出了一个通过 MCP 连接 Similarweb 市场情报数据的连接器,能够根据自然语言提示自动进行竞争性研究和演示文稿生成。
@ManusAI:新消息:Manus 现在通过升级的 @Similarweb 数据集成解锁更丰富的增长智能。您现在可以访问更…
Manus AI 已升级其与 Similarweb 的集成,使用户能够访问更丰富的网络智能并理解增长驱动因素。
@ManusAI: https://x.com/ManusAI/status/2062186859036631246
Manus帮助一个销售团队将HubSpot、Gmail和Slack整合到一个工作流中,使销售代表无需离开收件箱即可查看CRM详情,并为重要潜在客户启用Slack通知。
@wsl8297: 在 GitHub 挖到一个「100% 本地」的 Manus AI 开源替代方案:AgenticSeek。 它把本地推理模型和智能代理系统打包在一起:能自己逛网页、搜资料、填表单,能写代码、做规划,还支持语音对话。整体体验很接近电影里 Ja…
AgenticSeek 是一个 100% 本地的 Manus AI 开源替代方案,集成了本地推理模型和智能代理系统,支持网页浏览、编程、语音交互等,数据完全存储在本地。
@ManusAI: https://x.com/ManusAI/status/2055301295960146148
ManusAI 推出了一款 Google Drive 连接器,将静态存储转变为主动自动化引擎,使用户能够在 Manus 内跨 Docs、Sheets 和 Slides 进行读取、编辑和创建。