Anthropic 撤销针对 AI/ML 的静默削弱政策，将通知用户 [N]

Reddit r/MachineLearning 2026/06/11 08:51 新闻

anthropic policy-change ai-safety claude fable-5 safeguards notification

摘要

Anthropic 撤销了其在 AI/ML 开发中的静默削弱政策，现在当请求被拒绝或重定向到能力较低的模型时，将通知用户。

来自 Wired： > “我们正在改变 Fable 5 针对前沿 LLM 开发的保护措施，使其可见。”Anthropic 在给 WIRED 的声明中表示。“我们做出了错误的权衡，并为未能找到正确的平衡而道歉。” > Anthropic 现在表示正在改变方向，Claude Fable 5 针对 AI 开发的保护措施将对用户可见。如果公司怀疑用户试图利用 Claude 构建能力极强的 AI，它将提醒用户，要么拒绝请求，要么将用户重定向到能力较低的模型。完整文章：https://www.wired.com/story/anthropic-responds-to-backlash-on-claudes-secret-sabotage-on-ai-research/

查看原文

Anthropic 撤销针对 AI/ML 的静默削弱政策，将通知用户 [N]

相似文章

Anthropic 撤回了一项可能‘破坏’使用 Claude 的 AI 研究人员的政策

Anthropic Fable 5 的静默降级在24小时内被撤销，这更应引起你的担忧

Anthropic收回了一项‘破坏’研究人员工作的政策（2分钟阅读）

🤖 Anthropic就Claude Fable 5隐藏限制致歉

Anthropic撤回了一项可能‘阻挠’使用Claude的AI研究人员的政策

提交意见反馈