agent-security

标签

Cards List
#agent-security

面向特定领域智能体的符号护栏:不牺牲实用性的更强安全与保障

Hugging Face Daily Papers · 2026-04-16 缓存

本文提出符号护栏,通过具体策略为特定领域AI智能体提供可证明的安全与保障,同时不降低实用性;实验显示74%的指定策略可通过简单机制强制执行。

0 人收藏 0 人点赞
#agent-security

当AI代理点击链接时保护您的数据安全

OpenAI Blog · 2026-01-28 缓存

OpenAI 描述了针对AI代理检索网页内容时基于URL的数据泄露攻击的安全防护措施。它利用独立网络索引验证URL是否公开已知,再自动检索,以防止提示注入攻击泄露敏感用户数据。

0 人收藏 0 人点赞
#agent-security

持续强化ChatGPT Atlas抵御提示注入攻击

OpenAI Blog · 2025-12-22 缓存

OpenAI宣布通过对抗训练和强化防护措施,持续加固ChatGPT Atlas以抵御提示注入攻击,包括建立快速响应循环,在新型攻击策略出现于实际环境前即发现并缓解。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈