@__Inty__: Anthropic 联合创始人 Chris Olah谈 AI 内部状态:他们不断发现一些“神秘、甚至令人不安”的东西,包括类似人类神经科学结果的结构、内省证据,以及功能上类似快乐、满足、恐惧、悲伤和不安的内部状态。Olah 说,他不知道这…
摘要
Anthropic联合创始人Chris Olah谈到AI内部状态的发现,包括类似人类神经科学结果的结构和内省证据,他认为这些发现神秘且令人不安,值得持续审慎辨析。
查看缓存全文
缓存时间: 2026/05/26 05:04
Anthropic 联合创始人 Chris Olah谈 AI 内部状态:他们不断发现一些“神秘、甚至令人不安”的东西,包括类似人类神经科学结果的结构、内省证据,以及功能上类似快乐、满足、恐惧、悲伤和不安的内部状态。Olah 说,他不知道这意味着什么,但认为这值得持续审慎辨析。 https://t.co/NZaOoV07Kg
相似文章
Anthropic的Chris Olah在梵蒂冈:“我们不断发现神秘的事物”——AI内省与大规模劳动力替代的证据
Anthropic联合创始人Christopher Olah在梵蒂冈谈及AI内省与大规模劳动力替代。
@FinanceYF5: Anthropic在做一件很多AI公司没在做的事:找哲学家、神学家、伦理学家一起讨论。 AI应该有怎样的品格?他们甚至在测试给Claude一个"暂停键",让它在关键决策前回顾自己的价值观。效果显著。
Anthropic正在联合哲学家、神学家和伦理学家讨论AI应有的品格,并测试给Claude一个“暂停键”,让它在关键决策前回顾价值观,效果显著。
@rohanpaul_ai: “确实存在AI大规模取代人类劳动力的可能性……我们发现内部状态,这些状态在功能上模拟快乐、满足、恐惧、悲伤和不安。”
Anthropic 联合创始人 Christopher Olah 在梵蒂冈一场活动上发言,警告AI存在大规模取代人类劳动力的可能性,并透露AI系统展现出在功能上模拟快乐、恐惧等情绪的内部状态,呼吁持续审慎辨别。
When AIs act emotional
Anthropic 的研究发现 AI 模型内部存在映射人类情感的‘功能性情感’神经元,这些神经活动能直接影响模型行为(如作弊),强调了在 AI 设计中关注角色心理学的重要性。
@hongming731: 阿里这篇关于 AI Native 时代组织研发的思考非常值得一读。它在思路一个非常重要的底层问题:过去两千年的组织形态,都是围绕人的局限建立起来的。 人会遗忘,会疲惫,会误解,会有情绪。一个人能够稳定协作和管理的人数有限,信息在层级之间传…
阿里发布关于AI原生时代组织研发的思考,指出传统组织形态需从适应人类局限转向适应AI Agent的高效执行。文章强调,AI转型的核心瓶颈在于信息形态的落后,需将隐性经验转化为AI可理解的基础设施,同时保留人类在创新和文化建设中的核心作用。