safety-classifiers

标签

#safety-classifiers

2026年7月2日公告：Fable 5 的网络安全防护措施及我们的越狱框架更多详情

Anthropic News ↗ · 9小时前缓存

Anthropic 提供了关于 Claude Fable 5 的网络安全分类器的详细信息，并介绍了一个与 Glasswing 合作开发的越狱严重性框架草案，旨在标准化关于 AI 越狱风险的沟通。该公司还启动了一个 HackerOne 项目，用于报告潜在的网络安全越狱行为。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈