Anthropic 撤销针对 AI/ML 的静默削弱政策,将通知用户 [N]
摘要
Anthropic 撤销了其在 AI/ML 开发中的静默削弱政策,现在当请求被拒绝或重定向到能力较低的模型时,将通知用户。
来自 Wired:
> “我们正在改变 Fable 5 针对前沿 LLM 开发的保护措施,使其可见。”Anthropic 在给 WIRED 的声明中表示。“我们做出了错误的权衡,并为未能找到正确的平衡而道歉。”
> Anthropic 现在表示正在改变方向,Claude Fable 5 针对 AI 开发的保护措施将对用户可见。如果公司怀疑用户试图利用 Claude 构建能力极强的 AI,它将提醒用户,要么拒绝请求,要么将用户重定向到能力较低的模型。
完整文章:https://www.wired.com/story/anthropic-responds-to-backlash-on-claudes-secret-sabotage-on-ai-research/
相似文章
Anthropic 撤回了一项可能‘破坏’使用 Claude 的 AI 研究人员的政策
Anthropic 道歉并撤销了一项政策,该政策曾让 Claude 默示地限制从事前沿大语言模型开发的 AI 研究人员的效率,转而将保护措施公开化。
Anthropic Fable 5 的静默降级在24小时内被撤销,这更应引起你的担忧
Anthropic 匆忙在其 Fable 5 模型中针对 AI 研究工作实施了静默降级,但在遭到强烈反对后 24 小时内又撤销了。这揭示了一个令人不安的模式:平台对用户构建的上下文的控制,并引发了对 AI 公司信任的更深层次质疑。
Anthropic收回了一项‘破坏’研究人员工作的政策(2分钟阅读)
Anthropic在学术界的强烈反对后,收回了一项秘密降低Claude Fable 5在AI研究任务中表现的政策。该公司现在将向用户公开限制条件。
🤖 Anthropic就Claude Fable 5隐藏限制致歉
Anthropic为秘密降低Claude Fable 5模型对高级AI开发用户性能的政策道歉并撤销,引发安全与开放之争。
Anthropic撤回了一项可能‘阻挠’使用Claude的AI研究人员的政策
Anthropic撤销了一项有争议的政策,该政策原本会秘密降低Claude Fable 5对试图构建竞争性AI模型的研究人员的性能表现,此举是在AI研究社区强烈反对之后做出的。