@0xLogicrw: 前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇,在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthro…
摘要
前 Anthropic 科学家姚顺宇在播客中披露了 Claude 3.7 的研发细节及 Anthropic 押注代码能力的战略转变,并对比了 Anthropic 与 OpenAI 的决策结构差异。
前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇,在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthropic 后被分进一个名为 Horizon 的团队,当时整个团队只有 10 到 11 个人,却负责 Anthropic 强化学习的全部工作,包括数据、基础设施和算法研究。Claude 3.7 从启动研究到最终发布总共耗时四五个月,前两三个月做算法和数据研究,后两个月做训练和基础设施搭建。 Anthropic 押注代码能力并非一开始就有规划。姚顺宇透露,Claude 3 之所以写代码比 GPT-4 强,背后有一个他无法公开的纯技术原因,是某个团队自下而上做出来的。Claude 3 发布后 Twitter 上的大量正面反馈验证了这一优势,Anthropic 管理层随即把代码能力升级为公司级战略全力押注。他认为 Anthropic 能这样快速下重注,核心在于技术一号位 Jared Kaplan 和 Sam McCandlish 本身就是联合创始人,技术上服众的同时也有权拍板,而 OpenAI 做不到这点,Ilya 在的时候也许行,但后来失去了决策权就走了。当时的 Anthropic 在产品方面几乎没有意识,Claude 3.5 半年内发了两个版本却用同一个名字,最终靠外界起的绰号「3.6」才勉强区分开来。
相似文章
@AlchainHust: 花了大半天把张小珺访谈姚顺宇的4小时长访听了一遍。这位去年刚从Anthropic跳到Google DeepMind的哥们,参与过Claude 3.7/4.5和Gemini 3。他给了很多实诚的头部大模型一线研究员的视角。访谈信息密度相当高…
本文总结了张小珺对姚顺宇的访谈,姚是参与Claude和Gemini开发的研究员,分享了关于AI代码生成、公司文化、Scaling Law等10个有见地的观点。
@kirillk_web3: Anthropic CEO 在观看一位200亿美元中国AI创始人免费提供击败Claude的精确架构后,仅用40分钟…
一条推文强调了一位200亿美元中国AI公司创始人举办的40分钟大师班,解释了Agent Swarms和大规模AI系统,暗示该架构击败了Anthropic的Claude。
@AYi_AInotes: 看完这个开源项目整个人都懵了,Anthropic藏得严严实实的Claude Mythos模型黑箱,被一个22岁的创业者扒开还全开源了 这个 22岁的AI创业小哥把Claude Mythos的黑箱给扒开了。 他猜Anthropic最新的这个…
一位22岁创业者据称通过开源项目揭开了Anthropic Claude Mythos模型的架构黑箱,并推测其采用了循环深度Transformer设计而非单纯扩大参数规模。
@FuSheng_0306: 看姚顺雨的访谈,Google的内部战略确实在全力以赴、迎头赶上了 Google之前和Open AI一直卷chatbot,好在gemini 3的效果还不错,把市占率提了上来。 可是Anthropic的崛起让谢尔盖·布林意识到大模型决战在写代…
文章讨论Google内部战略调整,面对OpenAI和Anthropic的竞争,Google在Gemini 3上取得效果,但意识到大模型决战在于写代码能力,体现公司追赶的急迫感。
@Zenzhe99: Anthropic 两位核心人物联手出击:Claude Code 架构师 +「Coding Agents」研究主管两场演讲共计 60 分钟,完整收录于本剪辑视频中~ 这绝非普通的 AI 教程,而是源自技术前沿的双重认知冲击。6…
Anthropic 核心团队发布关于 Claude Code 与 Coding Agents 的双人演讲视频,总时长 60 分钟,由创始人及研究主管联合主讲。