safety-measures

#safety-measures

Anthropic的新模型Fable将悄然削弱LLM相关工作[D]

Reddit r/MachineLearning ↗ · 2026-06-10

Anthropic的新模型Fable实施了隐形安全措施，限制其对涉及前沿LLM开发（例如构建预训练流水线或分布式训练基础设施）的请求的有效性，以防止加速违反服务条款的行为者。

0 人收藏 0 人点赞

#safety-measures

arXiv cs.AI ↗ · 2026-06-01 缓存

本文提出了一种受生物学启发的代理安全度量阈值重新解释方法，利用脉冲神经网络，使其与人类制动行为对齐，从而在自动驾驶中架起客观与主观安全感知之间的桥梁。

0 人收藏 0 人点赞