safety-classifiers

标签

Cards List
#safety-classifiers

2026年7月2日 公告:Fable 5 的网络安全防护措施及我们的越狱框架更多详情

Anthropic News · 9小时前 缓存

Anthropic 提供了关于 Claude Fable 5 的网络安全分类器的详细信息,并介绍了一个与 Glasswing 合作开发的越狱严重性框架草案,旨在标准化关于 AI 越狱风险的沟通。该公司还启动了一个 HackerOne 项目,用于报告潜在的网络安全越狱行为。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈