标签
PolyRange是一个新的开源基准测试,用于评估网络目标上的攻击型AI能力,其设计通过每次部署生成新任务并包含主动防御层级来抵抗污染。
Dan Jeffries评论了Cloudflare对Anthropic的Mythos的测试,认为真正的讨论应聚焦于针对AI驱动的攻击的实际安全改进,并且如果团队调整工作流程,AI最终会让软件更安全。