别急着换用AI浏览器(除非你看完这个)

YouTube AI Channels 新闻

摘要

像OpenAI的Atlas和Perplexity的Comet这样的AI浏览器,将AI助手直接嵌入浏览过程,具备记忆和自主代理能力,但由于提示注入攻击带来的重大安全风险,它们不适合用于敏感用途。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/08 12:36

**TL;DR:** 像 OpenAI 的 Atlas 和 Perplexity 的 Comet 这类 AI 浏览器,承诺通过内置助手、记忆和代理能力彻底改变网页浏览体验。但关键的安全漏洞——尤其是提示注入攻击——使得它们除了轻度使用外,风险重重。 ## 什么是 AI 浏览器? 传统的浏览器如 Chrome 或 Firefox 只是通向互联网的直白窗口:你输入网址,页面加载,然后你在独立的标签页中点击操作,完全掌控自己的行为。AI 浏览器从根本上重塑了这种关系,将 AI 助手嵌入浏览体验的核心。 这不是一个独立标签页中的聊天机器人。AI 会观察所有标签页中的活动,理解上下文,并提供即时帮助,无需复制粘贴。三个核心功能使 AI 浏览器与众不同: - **侧车助手(Sidecar Assistant):** AI 像摩托车侧车一样伴随你的浏览——它能看到你去哪里、屏幕上有什么,但控制权仍在你手中。聊天自然地融入工作流。 - **浏览器记忆:** 与仅仅记录 URL 的传统历史记录不同,AI 浏览器保留了你浏览过的所有内容的上下文理解。正如原视频所述:“这就像一张你去过的地方列表,与对那里发生的每一次对话都有过目不忘的记忆之间的区别。” - **代理模式(Agent Mode):** AI 能够自主浏览页面并与网站交互——填写表单、预订酒店、完成各种任务,而你在一旁观察或完全做别的事情。 值得注意的是,Atlas、Comet 和 DIA 均基于 Chromium(Google 的开源引擎)构建——这意味着即使是 Chrome 的竞争对手,也依然依赖 Google 的基础。 ## 为什么公司在构建 AI 浏览器 这些公司将浏览器视为更宏大愿景的基石:能够真正代表你行动的 AI 代理。浏览器已经能访问一切——登录信息、历史记录、贯穿你整个数字生活的上下文。正如原视频所述:“这是 AI 能够观看并操作你整个数字生活的唯一场所。” - **OpenAI** 的目标是让 Atlas 成为 Sam Altman 所说的“你整个数字生活的真正超级助手”。 - **Perplexity** 认为,浏览器是构建真正有效代理的唯一可行路径。 - **The Browser Company** 认为,这将是五年后我们与技术互动的方式。 ## 重量级选手:Atlas vs. Comet ### OpenAI 的 Atlas Atlas 将 ChatGPT 置于浏览的核心。打开一个新标签页会看到熟悉的 ChatGPT 界面——被描述为“惊人地相似”于 Google 的新标签页。每个访问过的页面顶部都有一个“Ask ChatGPT”按钮。 Atlas 将 ChatGPT 从一个后台标签页转变为随时可用的功能,OpenAI 将其定位为以取代 Google 作为在线活动的起点。每周有超过 4 亿活跃用户,它已经影响了搜索行为和 SEO 实践。 **最适合:** 重度 ChatGPT 用户,希望学习成本最低。Atlas 使用熟悉的模型,提供丰富的上下文摘要,是最主流、最用户友好的选择。 **局限性:** 目前基础版仅限 macOS。Windows 和移动用户需要等待。 ### Perplexity 的 Comet Perplexity 于 2025 年 7 月推出 Comet,初期仅限 Perplexity Max 订阅用户(200 美元/月),随后在 10 月公开发布。与 Atlas 类似,它将 Perplexity 的 AI 驱动搜索集成为默认体验。 Comet 通过一套全面的工具套件实现差异化,这些工具都拥有专门的界面: - **Discover(发现):** 个性化内容推荐 - **Spaces(空间):** 项目组织 - **购物助手:** 跨零售商价格比较 - **旅行规划、财务追踪和体育动态** Perplexity 强调这些是“具有各自结构化数据的专用工具”,而不仅仅是重命名的提示词。 **最适合:** 研究人员、比价者,以及需要深入信息挖掘而非简单摘要的用户。 **权衡:** 免费的 Comet 浏览器资源消耗较大,比 Chrome 占用更多系统内存——可能会拖慢较老的机器。每月 200 美元的 Perplexity Max 订阅增加了后台助手和邮件助手,能够起草回复、整理收件箱、安排会议,并根据浏览模式主动提供建议。 ## 其他方案 ### DIA(The Browser Company) DIA 代表了极简主义的对照。如果说 Atlas 和 Comet 追求功能最大化,DIA 基本上只是一个内置了 AI 聊天的 Chromium 浏览器——没有功能过载,不尝试做所有事。其网站上的技能库提供了从色彩分析到邮件措辞等任务的示例提示词。 **最适合:** 担心完全代理浏览安全影响的用户。功能更少意味着风险面更小。适合那些想要 AI 帮助但又不想交出完全控制权的用户。 ### Nemo(Nemo Planet) 由前 Google Chrome 工程师创立,Nemo 完全摒弃了传统的地址栏和标签页,采用画布式界面,AI 卡片将应用组织到自定义工作空间中。尽管设计激进,它仍然基于 Chromium。 用户可以指示 Nemo 构建自定义界面——例如一个从 Sheets、Notion 和 Gmail 提取数据的个人财务仪表盘。目前仅限邀请制,学习曲线较陡,Nemo 被描述为“对大多数人来说可能太实验性了”,但它代表了唯一真正重新思考浏览器可能性的方案,而不仅仅是在 Chrome 上添加 AI。 ## 安全难题 尽管功能令人印象深刻,但 AI 浏览器面临着严峻的安全挑战,影响着从功能丰富到极简主义的整个谱系。 ### 所需的访问权限 有效的 AI 浏览需要广泛的权限:电子邮件、日历、密码、支付信息、浏览历史。原视频称这相当于在完全理解 AI 浏览的含义之前就“对这个系统寄予了大量信任”。“如果说 AI 聊天模型是黑箱,那 AI 浏览就是个黑洞。” ### 提示注入攻击 最重大的威胁是**提示注入**——网页上覆盖用户指令的隐藏指令。这些指令可以藏在页面源代码中,或者以白字白底的方式隐藏——对用户不可见,但 AI 可以读取并执行,导致数据泄露直到为时已晚才被发现。 **行业领导者的关键承认:** - OpenAI 首席信息安全官 Dane Stucky 公开承认,提示注入仍然是一个“尚未解决的安全问题”,并指出“我们的对手会投入大量时间和资源,想方设法让 ChatGPT 代理中招。” - Perplexity 团队也承认了类似挑战,称其为“整个行业都在艰难应对的安全问题。” **具体证据:** Brave 安全研究人员成功诱使 Perplexity 的 Comet 浏览器显示了危险提示。即使公司尝试修复,漏洞依然存在。 ### 隐私维度 除了技术漏洞外,AI 浏览器本质上会监视你的在线活动。虽然存在隐私模式,公司也承诺可退出数据训练,但用户在他们不拥有的平台上创建了广泛的数字生活数据库。原视频强调:“即使你可以下载自己的数据,你无法控制谁有权访问它。” 对于处理敏感数据的用户来说,问题在于你是否愿意放心地让 AI 系统“完全访问这些信息并能够记住它们。” ### 为什么不能简单地打补丁 安全专家指出,这并不是一个 bug,而是 AI 处理信息方式的基本特征。只要 AI 从不受信任的网站读取内容并据此行动,操纵就仍有可能。公司实施了多层保护——红队测试、训练模型忽略恶意指令、检测系统、用户控制——但这些只是缓解策略,而非解决方案。原视频将其描述为“一场猫鼠游戏,新的攻击方法不断涌现。” ## 结论:你应该换用吗? AI 浏览器展示了令人印象深刻的技术,并指向了浏览的未来,但目前更像是“尚未准备好处理任何关键任务的测试版产品。” **推荐用途:** 轻度浏览——研究、学习、探索。 **避免用于:** 敏感交易,包括银行业务、工作邮件和个人文件,直到安全问题真正解决而非仅仅缓解。 ## 未来展望 这一领域发展迅速。微软继续将 Copilot 整合到 Edge 中。Google 将 Gemini 扩展到 Chrome。Opera 已带着 Neon 入局。Chrome 十多年来从未遇到过真正的竞争,这表明未来几个月主要 AI 玩家将发布更多公告。正如原视频总结:“浏览器战争正式回归。” 来源:Don't Switch to an AI Browser (Until You Watch This) (https://www.youtube.com/watch?v=wsnola4w7Q0)

相似文章

关于Amazon诉Perplexity的说明(阅读时间27分钟)

TLDR AI

亚马逊正起诉Perplexity AI,因其Comet浏览器的代理功能涉嫌伪装成人类用户偷偷访问亚马逊平台,造成安全与信任风险。此案凸显了AI代理工具与网站访问控制之间日益紧张的矛盾。

@GitHub_Daily: 让 AI Agent 自动化操作浏览器或抓数据,经常被各种反爬机制拦截,遇到验证码、人机验证直接卡死。 最近 BrowserAct 团队开源了一个 Skill,专为 AI Agent 设计的浏览器自动化命令行工具。 提供三层反封锁机制,从…

X AI KOLs Timeline

BrowserAct 团队开源了一个专为 AI Agent 设计的浏览器自动化命令行工具,提供三层反封锁机制(指纹伪装、验证码破解、人类接管),支持多浏览器并行、账户隔离,并优化了输出格式以节省Token。

推出 ChatGPT Atlas,内置 ChatGPT 的浏览器

OpenAI Blog

OpenAI 推出了 ChatGPT Atlas,一款内置 ChatGPT 的网络浏览器,让用户可以在整个网络上访问 AI 助手,具有集成记忆、上下文感知和 Agent 模式功能。该产品今天在 macOS 上为免费版、Plus、Pro 和 Go 用户推出,Windows、iOS 和 Android 版本即将推出。