containment

标签

Cards List
#containment

遏制缺口:已部署的自主AI框架如何未能满足面向公众的安全要求

arXiv cs.AI · 2天前 缓存

本文审计了LangChain、AutoGPT和OpenAI Agents SDK在架构安全保证方面的表现,发现它们均未原生符合遏制原则,并展示了内存投毒如何导致持续性失败;文中还引入了轻量级机制以消除此类攻击。

0 人收藏 0 人点赞
#containment

@AnthropicAI:工程博客新文章:我们授予代理的访问权限应随其能力而进化。在我们的产品中,我们通过沙盒化来设置这些参数,以限制潜在破坏性操作的范围…

X AI KOLs · 2026-05-26 缓存

Anthropic 的工程博客详细介绍了他们如何通过沙盒化和访问控制来隔离各产品中的 Claude 代理,以限制爆炸半径,并分享了部署 Claude Code、Claude Cowork 和 claude.ai 的经验教训。

0 人收藏 0 人点赞
#containment

我们如何在多个产品中管控Claude

Anthropic Engineering · 2026-05-26 缓存

Anthropic讨论了如何通过遏制架构限制影响范围并减少人类监督疲劳,从而在多个产品中管控Claude,并分享了从部署Claude.ai、Claude Code和Claude Cowork中获得的经验教训。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈