agent-security

#agent-security

面向特定领域智能体的符号护栏：不牺牲实用性的更强安全与保障

Hugging Face Daily Papers ↗ · 2026-04-16 缓存

本文提出符号护栏，通过具体策略为特定领域AI智能体提供可证明的安全与保障，同时不降低实用性；实验显示74%的指定策略可通过简单机制强制执行。

0 人收藏 0 人点赞

#agent-security

OpenAI Blog ↗ · 2026-01-28 缓存

OpenAI 描述了针对AI代理检索网页内容时基于URL的数据泄露攻击的安全防护措施。它利用独立网络索引验证URL是否公开已知，再自动检索，以防止提示注入攻击泄露敏感用户数据。

0 人收藏 0 人点赞

#agent-security

OpenAI Blog ↗ · 2025-12-22 缓存

OpenAI宣布通过对抗训练和强化防护措施，持续加固ChatGPT Atlas以抵御提示注入攻击，包括建立快速响应循环，在新型攻击策略出现于实际环境前即发现并缓解。

0 人收藏 0 人点赞