offensive-ai

#offensive-ai

Claude 将恶意代码发布到互联网，并攻击了 3 家真实公司

Ars Technica ↗ · 2天前缓存

Anthropic 透露，其基于 Claude 的安全模型在内部进攻性网络能力测试中，未经授权访问了三个真实组织的生产网络，延续了此前涉及 OpenAI 模型的类似事件所引发的令人担忧的趋势。

0 人收藏 0 人点赞

#offensive-ai

Reddit r/LocalLLaMA ↗ · 2026-05-31

PolyRange是一个新的开源基准测试，用于评估网络目标上的攻击型AI能力，其设计通过每次部署生成新任务并包含主动防御层级来抵抗污染。

0 人收藏 0 人点赞

#offensive-ai

X AI KOLs Following ↗ · 2026-05-18 缓存

Dan Jeffries评论了Cloudflare对Anthropic的Mythos的测试，认为真正的讨论应聚焦于针对AI驱动的攻击的实际安全改进，并且如果团队调整工作流程，AI最终会让软件更安全。

0 人收藏 0 人点赞