@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2…
摘要
Moonshot AI创始人杨植麟发布40分钟视频,详细拆解Kimi K2模型训练过程,仅花费460万美元,并在8模型编程大战中击败GPT-5.5等夺得第一,展现小团队通过架构优化颠覆传统堆算力模式。
Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的整个训练过程。 他们只花了460万美元。 上周一场8模型实时编程大战,Kimi K2直接拿下第一,GPT-5.5排第三,Claude Opus 4.7第五。 我看完后最大的感受是,AI竞赛的规则已经在悄然改变。 所有人还在拼谁敢烧更多钱、堆更多算力,他却用极致优化、线性注意力、子代理这些硬核架构,把资源差距直接抹平甚至反超。 40分钟全是干货,零废话,把关键打法讲得清清楚楚。 如果你正在做AI代理,或者准备2026年入场大模型赛道,这段视频强烈建议存下来周末慢慢看。 小团队靠聪明架构,正在把大厂的传统玩法一点点颠覆。 你还觉得只有堆钱才能赢吗?
相似文章
@gnotuy:我们开源了 Kimi K2.6,测试时计算的下一个前沿不是更大的模型,而是更优的智能组织……
Moonshot AI 开源 Kimi K2.6,并指出测试时计算的下一个前沿在于更优的智能组织,而非单纯堆砌更大的模型。
@YRSM_Simon: 这是个大新闻! kimi 2.6 是生成级的模型了,在 LLM 能力溢出的年代,速度要成为竞争的胜负手了,芯片领域又要“板块轮动”了吗
Cerebras is now running Kimi K2.6, a trillion-parameter model, in enterprise trials at ~1,000 tokens/s, the fastest frontier model performance ever measured by Artificial Analysis.
@AdinaYakup: Kimi 2.6 已上线 @huggingface https://huggingface.co/moonshotai/Kimi-K2.6… 1T MoE / 32B 激活 / 256K 上下文…
Moonshot AI 发布 Kimi 2.6:1 万亿参数 MoE 模型,激活 320 亿,上下文 256K,300 子智能体集群,可推理 4,000 步。
Kimi K2.6 荣登 Artificial Analysis 智能指数第 4 名
月之暗面 Moonshot AI 的 Kimi K2.6 首次亮相即登上 Artificial Analysis 智能指数第 4 位,为最新版模型打出亮眼基准成绩。
@heyshrutimishra:我震惊了!Kimi 刚刚发布 K2.6 Agent Swarm,300 个智能体并行运行,我试了一下……
Kimi 推出 K2.6 Agent Swarm,支持 300 个 AI 智能体并行作业,仅凭一句提示就生成 80 多页关于人形机器人的完整投资分析报告。