构建了一个工具,防止AI代理被网页和邮件中的恶意内容劫持

Reddit r/artificial 工具

摘要

Arc Gate 是一个代理,通过将网页和邮件内容视为不可信,保护AI代理免受提示注入攻击,且开发者无需修改代码。

如果你听说过提示注入(其中网页中的隐藏指令可以接管AI代理),那么这是一个为在生产环境中部署代理的开发者提供的实用解决方案。Arc Gate 是一个位于任何兼容 OpenAI 的 API 前面的代理。它会追踪哪些主体被允许向代理发出指令。当网页或邮件尝试发出指令时,会被视为零指令权限的不可信内容。代理得到保护,开发者无需更改任何内容,只需更改 API URL。此处有一个演示,展示了使用和未使用它的具体情况:https://web-production-6e47f.up.railway.app/arc-gate-demo
查看原文

相似文章

当AI代理点击链接时保护您的数据安全

OpenAI Blog

OpenAI 描述了针对AI代理检索网页内容时基于URL的数据泄露攻击的安全防护措施。它利用独立网络索引验证URL是否公开已知,再自动检索,以防止提示注入攻击泄露敏感用户数据。

别急着换用AI浏览器(除非你看完这个)

YouTube AI Channels

像OpenAI的Atlas和Perplexity的Comet这样的AI浏览器,将AI助手直接嵌入浏览过程,具备记忆和自主代理能力,但由于提示注入攻击带来的重大安全风险,它们不适合用于敏感用途。

设计能抵抗提示词注入的AI智能体

OpenAI Blog

OpenAI发布了关于设计抗提示词注入攻击的AI智能体的指导意见,指出现代攻击日益采用社会工程学策略而非简单的字符串注入,并倡导采用系统级防御措施来限制影响范围,而不是单纯依赖输入过滤。

今日宣布 AI 网络代理再次免费

Reddit r/AI_Agents

作者发布了 StealthFox,这是一个开源的 Firefox 分支,旨在通过在 C++ 级别生成独特且一致的浏览器指纹,帮助 AI 网络代理绕过反机器人系统。