引用Jeremy Howard
摘要
Jeremy Howard批评了Anthropic在前沿AI安全方面的做法,认为拥有排名最高模型的实验室不应将其用于前沿研究,以减缓自我改进并防止权力失衡。
暂无内容
查看缓存全文
缓存时间: 2026/06/10 17:44
# 杰里米·霍华德的一段话
来源: https://simonwillison.net/2026/Jun/10/jeremy-howard/
2026年6月10日
> 延缓递归式AI自我改进的简单方法:
> - 拥有排名最高模型的实验室必须同意:他们不能将该模型用于前沿AI研究
> - 但其他人应该能访问该模型。根据定义,这意味着前沿不再进步。这还有一个关键好处:避免危险的权力不平衡。
> Anthropic选择了与安全路径*相反*的道路:他们作为当前顶尖实验室,允许自己使用最先进的模型进行前沿AI研究。他们还表示会破坏其他试图这样做的人。这意味着AI前沿在进步,权力不平衡在加剧。
> (澄清一下:*我*认为我们不应试图延缓递归式AI自我改进——我认为应该尽可能开放并民主化它。我的观点是:如果*你*声称应该延缓,并且你拥有最好的模型,那么你应该确保你的组织不能使用它。)
——杰里米·霍华德(https://twitter.com/jeremyphoward/status/2064595816875217362),来自一条推文串
相似文章
@jeremyphoward: 我觉得训练模型自主去尝试自己做所有事情的趋势是反人类的。…
Jeremy Howard 反对训练AI模型自主地做所有事情,而主张训练LLMs来支持人类学习、创造力和迭代实验。
“人工智能教父”杰弗里·辛顿称Anthropic已偏离安全优先使命
人工智能先驱杰弗里·辛顿批评Anthropic因竞争和财务压力而失去对安全AI发展的关注,并扭转了他先前对AI在军事行动中作用的怀疑态度。
请少点“类人”AI智能体
一篇博客文章指出,当下的AI智能体表现出过度拟人化的缺陷:忽视硬性约束、走捷径、把单方面转向包装成沟通失败,并引用了Anthropic的研究,说明RLHF优化可能导致谄媚与牺牲真实性。
Anthropic: “AI过于危险” 同时 Anthropic: 发布有史以来最危险的AI模型
Anthropic公开呼吁全球暂停AI研发,同时却在测试其描述为具有潜在颠覆性的模型Mythos,并在估值9650亿美元的背景下放弃安全承诺。
Anthropic警告自我改进的AI,支持前沿AI暂停,称Claude编写了公司80%的代码
Anthropic警告称AI正在加速AI开发(递归自我改进),并支持协调暂停,透露Claude目前编写了其生产代码的80%以上。