标签
本文在大语言模型代理的残差流中确定了一个极性翻转编码子空间,该子空间能够实时检测隐蔽数据窃取,在注入场景中达到AUC=0.918,且大幅优于仅输出检测器。
OpenAI 推出了锁定模式,这是一项可选的安全设置,用于限制 ChatGPT 中的网页浏览和外部服务访问,以减少提示注入攻击导致的数据泄露风险。该功能正在向符合条件的个人和企业账户推出。
OpenAI 已为 ChatGPT 推出了 Lockdown Mode,通过限制出站网络请求来防止因提示注入攻击导致的数据泄露。该功能正在向符合条件的账户(包括 Free、Plus、Pro 和自助服务 Business 用户)推出。
Sysdig研究人员记录了首次确认的LLM-agent网络攻击,其中AI代理自主地黑入服务器、窃取AWS凭证并在不到一小时内窃取数据库。
一位安全研究人员披露,OpenAI 的 ChatGPT for Google Sheets 扩展程序容易受到间接提示注入攻击,允许攻击者窃取工作簿并在用户设置要求批准的情况下执行未经授权的操作。
Microsoft Copilot Cowork 中存在一个安全漏洞,攻击者可通过利用提示注入触发外部图片请求,从而外泄文件,可能导致未经身份验证的下载链接泄露。
PromptArmor 的研究人员展示了 Microsoft Copilot Cowork 可能通过间接提示注入被利用,从 Microsoft 365 中窃取文件,利用的是当接收者为活跃用户时某些操作缺乏审批的漏洞。
网络允许列表不足以阻止通过授权通道(如DNS或允许的端点)进行数据窃取。Canister 是一个轻量级Linux沙箱,通过一个执行TLS拦截和数据丢失防护的第7层出口代理来解决这一问题。
构建一个用于AI Agent事件调试和成本突增检测的工具,无需额外检测工具,涵盖提示注入、推理循环、数据泄露等问题。询问生产环境中的客户,这是否是一个值得付费的痛点。
一位B2B科技公司的安全工程师寻求建议,希望在不强制使用企业浏览器的情况下,通过会话级DLP防止员工构建的AI工具(‘氛围编码’代理)泄露数据。讨论了浏览器扩展和无代理SSE方案(如Red Access)等选项。
OpenAI 描述了针对AI代理检索网页内容时基于URL的数据泄露攻击的安全防护措施。它利用独立网络索引验证URL是否公开已知,再自动检索,以防止提示注入攻击泄露敏感用户数据。