@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者，前Google Brain和Meta研究员，坐在镜头前平静拆解了Kimi K2…

X AI KOLs Timeline 2026/05/14 01:19 模型

moonshot-ai kimi-k2 efficient-training linear-attention sub-agents ai-competition open-source

摘要

Moonshot AI创始人杨植麟发布40分钟视频，详细拆解Kimi K2模型训练过程，仅花费460万美元，并在8模型编程大战中击败GPT-5.5等夺得第一，展现小团队通过架构优化颠覆传统堆算力模式。

Moonshot AI创始人杨植麟最近放出了一个40分钟视频。这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者，前Google Brain和Meta研究员，坐在镜头前平静拆解了Kimi K2的整个训练过程。他们只花了460万美元。上周一场8模型实时编程大战，Kimi K2直接拿下第一，GPT-5.5排第三，Claude Opus 4.7第五。我看完后最大的感受是，AI竞赛的规则已经在悄然改变。所有人还在拼谁敢烧更多钱、堆更多算力，他却用极致优化、线性注意力、子代理这些硬核架构，把资源差距直接抹平甚至反超。 40分钟全是干货，零废话，把关键打法讲得清清楚楚。如果你正在做AI代理，或者准备2026年入场大模型赛道，这段视频强烈建议存下来周末慢慢看。小团队靠聪明架构，正在把大厂的传统玩法一点点颠覆。你还觉得只有堆钱才能赢吗？

查看原文

相似文章

@FinanceYF5: Kimi打赢美国模型的关键技术之一，源头或许是创始人杨植麟十年前写的博士论文。他34岁，清华本科+CMU博士，读博期间在Meta AI和Google Brain都待过。那篇引超1万次的XLNet，脉络后来变成Kimi K2的万亿参数Mo…

X AI KOLs Following

文章指出Kimi击败美国模型的关键技术可能源于其创始人杨植麟十年前的博士论文，提到了XLNet与Kimi K2的万亿参数MoE架构的联系。

@gnotuy：我们开源了 Kimi K2.6，测试时计算的下一个前沿不是更大的模型，而是更优的智能组织……

X AI KOLs Following

Moonshot AI 开源 Kimi K2.6，并指出测试时计算的下一个前沿在于更优的智能组织，而非单纯堆砌更大的模型。

@zhang_benita: https://x.com/zhang_benita/status/2078716535548600458

X AI KOLs Timeline

本文采访了Moonshot AI创始人杨植麟，讨论了构建基础模型和AI助手Kimi的挑战与愿景，并反思了过去一年的发展。

Kimi K3，以及我们还能从pelican基准测试中学到什么

Simon Willison's Blog

中国AI实验室Moonshot AI发布了Kimi K3，一个2.8万亿参数的开源权重模型，声称这是首个开源的3T级模型，并在多个基准测试中击败了多个领先模型。文章还讨论了该模型的定价以及一个有趣的pelican SVG基准测试。

@seclink: 官方页面地址： https://huggingface.co/moonshotai/Kimi-K3… 这是 Moonshot AI（月之暗面）发布的 2.8 万亿参数（MoE 架构，激活约 104B）开源权重模型，支持原生多模态（文本+图…