jailbreak-framework

标签

Cards List
#jailbreak-framework

@levie: 事情似乎正在朝着更好的方向发展,Fable 和接下来的 GPT-5.6 可能也是如此。我们现在所拥有的是初步的…

X AI KOLs Following · 2天前 缓存

讨论了前沿AI模型安全审查流程的演变,提到了Claude Fable 5的重新发布,以及需要建立一个共享的行业框架来评估越狱攻击,同时对安全与创新之间的平衡表达了谨慎乐观。

0 人收藏 0 人点赞
#jailbreak-framework

2026年7月2日 公告:Fable 5 的网络安全防护措施及我们的越狱框架更多详情

Anthropic News · 5小时前 缓存

Anthropic 提供了关于 Claude Fable 5 的网络安全分类器的详细信息,并介绍了一个与 Glasswing 合作开发的越狱严重性框架草案,旨在标准化关于 AI 越狱风险的沟通。该公司还启动了一个 HackerOne 项目,用于报告潜在的网络安全越狱行为。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈