@0xLogicrw: 前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇,在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthro…

X AI KOLs Timeline 新闻

摘要

前 Anthropic 科学家姚顺宇在播客中披露了 Claude 3.7 的研发细节及 Anthropic 押注代码能力的战略转变,并对比了 Anthropic 与 OpenAI 的决策结构差异。

前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇,在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthropic 后被分进一个名为 Horizon 的团队,当时整个团队只有 10 到 11 个人,却负责 Anthropic 强化学习的全部工作,包括数据、基础设施和算法研究。Claude 3.7 从启动研究到最终发布总共耗时四五个月,前两三个月做算法和数据研究,后两个月做训练和基础设施搭建。 Anthropic 押注代码能力并非一开始就有规划。姚顺宇透露,Claude 3 之所以写代码比 GPT-4 强,背后有一个他无法公开的纯技术原因,是某个团队自下而上做出来的。Claude 3 发布后 Twitter 上的大量正面反馈验证了这一优势,Anthropic 管理层随即把代码能力升级为公司级战略全力押注。他认为 Anthropic 能这样快速下重注,核心在于技术一号位 Jared Kaplan 和 Sam McCandlish 本身就是联合创始人,技术上服众的同时也有权拍板,而 OpenAI 做不到这点,Ilya 在的时候也许行,但后来失去了决策权就走了。当时的 Anthropic 在产品方面几乎没有意识,Claude 3.5 半年内发了两个版本却用同一个名字,最终靠外界起的绰号「3.6」才勉强区分开来。
查看原文

相似文章