safety-measures

标签

Cards List
#safety-measures

Anthropic的新模型Fable将悄然削弱LLM相关工作[D]

Reddit r/MachineLearning · 2天前

Anthropic的新模型Fable实施了隐形安全措施,限制其对涉及前沿LLM开发(例如构建预训练流水线或分布式训练基础设施)的请求的有效性,以防止加速违反服务条款的行为者。

0 人收藏 0 人点赞
#safety-measures

以神经元脉冲阈值重新诠释安全阈值

arXiv cs.AI · 2026-06-01 缓存

本文提出了一种受生物学启发的代理安全度量阈值重新解释方法,利用脉冲神经网络,使其与人类制动行为对齐,从而在自动驾驶中架起客观与主观安全感知之间的桥梁。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈