AI代理只需一次提示注入,就可能做出你绝不会要求它们做的事。我们构建了一个修复方案。
摘要
PixieBrix 推出 Agent Browser Shield,这是一款免费、源代码可用的浏览器扩展,可保护AI代理在浏览网页时免受提示注入、暗黑模式和上下文污染的影响。
如今全球有60亿互联网用户。随着AI代理的普及,我们正朝着数千亿‘用户’涌入网络的方向发展。如果你使用 OpenClaw 进行浏览,你的代理基本上毫无防护,无法应对人类已经学会警惕的那些东西,比如虚假评论、暗黑模式、隐藏在页面内容中旨在劫持其行为的指令。我在 PixieBrix 的团队多年来一直帮助BPO联络中心防范浏览器中的内部风险和社会工程攻击。于是我们把同样的思路应用到了AI代理上。**结果就是我们刚刚发布到 ClawHub 和 GitHub 上的 Agent Browser Shield,一款免费、源代码可用的浏览器扩展。**将其与你的 OpenClaw 配置一同安装,它会伴随你的代理运行,位于浏览器与代理之间,拦截以下内容:
* 提示注入(页面内容中的可见和隐藏指令)
* 暗黑模式(旨在操纵或胁迫的UI)
* 上下文污染(影响指令遵循的低价值垃圾信息)
额外好处:去除无关内容还能减少使用的 token。更安全,运行成本更低!
不过,这个问题尚未解决。我们正在公开构建该项目,因为代理浏览的发展速度远超任何单个团队所能追踪。我们正在衡量改进效果,并计划逐步分享基准测试。我们希望社区能帮助我们确定重点方向。快来和我们一起构建吧!
🦞 在 ClawHub 上关注:[https://clawhub.ai/pixiebrix/agent-browser-shield](https://clawhub.ai/pixiebrix/agent-browser-shield)
⭐ 在 GitHub 上关注:[https://github.com/pixiebrix/agent-browser-shield](https://github.com/pixiebrix/agent-browser-shield)
你见过你的 OpenClaw 代理在页面上做出过哪些奇怪的行为?好奇你遇到了什么,这样我们可以制定更多规则。
相似文章
Agent Browser Shield
Agent Browser Shield 是一款阻止提示注入攻击并降低 AI 浏览器代理 token 成本的产品。
设计能抵抗提示词注入的AI智能体
OpenAI发布了关于设计抗提示词注入攻击的AI智能体的指导意见,指出现代攻击日益采用社会工程学策略而非简单的字符串注入,并倡导采用系统级防御措施来限制影响范围,而不是单纯依赖输入过滤。
理解提示词注入:AI安全的前沿挑战
OpenAI发布了关于提示词注入攻击的指导,这是一种社会工程漏洞,恶意指令可以隐藏在网页内容或文档中,诱骗AI模型执行意外操作。该公司概述了其多层防御策略,包括指令层级研究、自动化安全测试和AI驱动的监控系统。
别急着换用AI浏览器(除非你看完这个)
像OpenAI的Atlas和Perplexity的Comet这样的AI浏览器,将AI助手直接嵌入浏览过程,具备记忆和自主代理能力,但由于提示注入攻击带来的重大安全风险,它们不适合用于敏感用途。
免费AI代理安全评估
Antitech 为AI代理提供免费的早期安全评估服务,针对提示注入、工具滥用、数据泄露等攻击向量进行测试,并提供漏洞报告和参与折扣。