@SaitoWu: 十年前百度美研一群人就预判:不能把 AI 算力全押在英伟达身上。结果他们真的投了一家「晶圆级」芯片公司 —Cerebras。 2016 年,周楠从投行跳去百度美国人工智能研究院。那时候吴恩达带队,预算充足,GPU 随便买。Dario(An…

X AI KOLs Timeline 新闻

摘要

文章回顾了百度美研十年前投资Cerebras晶圆级芯片公司的故事,分析了AI芯片市场从训练到推理的转变,以及非共识投资的重要性。

十年前百度美研一群人就预判:不能把 AI 算力全押在英伟达身上。结果他们真的投了一家「晶圆级」芯片公司 —Cerebras。 2016 年,周楠从投行跳去百度美国人工智能研究院。那时候吴恩达带队,预算充足,GPU 随便买。Dario(Anthropic 创始人)和 Greg Diamond 都在那里。团队已经隐约摸到 scaling law 的雏形:模型越大、数据越多、算力越强,效果就越好。DeepSpeech2 那篇论文就是最早的信号之一。 周楠做的第一个项目就是 Cerebras。当时他满世界找「不是英伟达」的训练芯片,看了 Graphcore、Wave Computing,最后选了 Cerebras。因为这家公司最激进——要做 wafer-scale engine,把一整片晶圆做成一个巨大的 AI 计算引擎,让计算单元和内存靠得极近,大幅降低通信成本。 投的时候 Cerebras 连流片都没有,只有 signature。百度美研的研究员直接上手验证,在当时全球最大的语言模型上跑,信号还不错。投决会几乎零阻力,Robin、陆奇、李彦宏快速通过。估值当时已经 7 亿多刀,在 2017 年算贵,但周楠赌的是「非共识」。 真正难的不是 idea,而是把 wafer-scale 做出来。良率、散热、电源、编译器,每一个都是硬骨头。2017-2019 年几乎是至暗时刻,流片一延再延。但 Benchmark、Foundation、Eclipse 等早期投资人一直陪,给了足够耐心。芯片真的要十年才能看到结果。 现在 Cerebras 的机会在推理,而不是训练。OpenAI 签下至少 200 亿刀大单,就是看中它低延迟、高吞吐。英伟达的 CUDA 生态太强,训练阶段迁移成本极高,但推理场景下,Cerebras 的架构优势开始显现。Sam Altman 其实 2016 年就个人投了 Cerebras,比百度还早。 周楠感慨,百度美研其实是硅谷的「黄埔军校」。后来出去创业的人太多:Inflection、Adept、Anthropic、Cohere……可惜因为地缘政治,百度后来想单独募一个专注 AI 的基金没成,OpenAI、Databricks 当时都在 list 上,最终都没投成。 十年前大家就担心不能只依赖英伟达,结果英伟达还是成了事实垄断。但现在推理需求爆发,反而给了异构芯片新窗口。Cerebras 只是开始,后面可能还会有更多新架构的推理芯片出现。 周楠现在看 AI 投资:共识来得太快,早期窗口越来越短。他反而更关注还没形成共识的方向,比如 Physical AI(机器人)和新的推理芯片架构。这期节目最打动人的,是把十年前 scaling law 刚冒头、百度美研那批人「神仙打架」的氛围还原了出来。很多事情早早被看到,但真正落地要等十年。Cerebras 的故事,只是其中一个缩影。
查看原文
查看缓存全文

缓存时间: 2026/06/17 18:02

十年前百度美研一群人就预判:不能把 AI 算力全押在英伟达身上。结果他们真的投了一家「晶圆级」芯片公司 —Cerebras。

2016 年,周楠从投行跳去百度美国人工智能研究院。那时候吴恩达带队,预算充足,GPU 随便买。Dario(Anthropic 创始人)和 Greg Diamond 都在那里。团队已经隐约摸到 scaling law 的雏形:模型越大、数据越多、算力越强,效果就越好。DeepSpeech2 那篇论文就是最早的信号之一。

周楠做的第一个项目就是 Cerebras。当时他满世界找「不是英伟达」的训练芯片,看了 Graphcore、Wave Computing,最后选了 Cerebras。因为这家公司最激进——要做 wafer-scale engine,把一整片晶圆做成一个巨大的 AI 计算引擎,让计算单元和内存靠得极近,大幅降低通信成本。

投的时候 Cerebras 连流片都没有,只有 signature。百度美研的研究员直接上手验证,在当时全球最大的语言模型上跑,信号还不错。投决会几乎零阻力,Robin、陆奇、李彦宏快速通过。估值当时已经 7 亿多刀,在 2017 年算贵,但周楠赌的是「非共识」。

真正难的不是 idea,而是把 wafer-scale 做出来。良率、散热、电源、编译器,每一个都是硬骨头。2017-2019 年几乎是至暗时刻,流片一延再延。但 Benchmark、Foundation、Eclipse 等早期投资人一直陪,给了足够耐心。芯片真的要十年才能看到结果。

现在 Cerebras 的机会在推理,而不是训练。OpenAI 签下至少 200 亿刀大单,就是看中它低延迟、高吞吐。英伟达的 CUDA 生态太强,训练阶段迁移成本极高,但推理场景下,Cerebras 的架构优势开始显现。Sam Altman 其实 2016 年就个人投了 Cerebras,比百度还早。

周楠感慨,百度美研其实是硅谷的「黄埔军校」。后来出去创业的人太多:Inflection、Adept、Anthropic、Cohere……可惜因为地缘政治,百度后来想单独募一个专注 AI 的基金没成,OpenAI、Databricks 当时都在 list 上,最终都没投成。

十年前大家就担心不能只依赖英伟达,结果英伟达还是成了事实垄断。但现在推理需求爆发,反而给了异构芯片新窗口。Cerebras 只是开始,后面可能还会有更多新架构的推理芯片出现。

周楠现在看 AI 投资:共识来得太快,早期窗口越来越短。他反而更关注还没形成共识的方向,比如 Physical AI(机器人)和新的推理芯片架构。这期节目最打动人的,是把十年前 scaling law 刚冒头、百度美研那批人「神仙打架」的氛围还原了出来。很多事情早早被看到,但真正落地要等十年。Cerebras 的故事,只是其中一个缩影。

相似文章

@LuBtc888: 孙宇晨10年前让大家关注英伟达,后来英伟达涨了200多倍, 而在去年他说:“短期缺芯片,长期缺能源,永远缺存储”, 结果存储赛道也涨了几十倍。 最近他又说:“虚拟AI的红利已经快结束了,未来3年真正的主线是物理AI!” 最重要的是,他不是…

X AI KOLs Timeline

孙宇晨近期表示虚拟AI红利将尽,未来三年主线是物理AI,并已投资10亿美元。过去他的预测(英伟达、存储赛道)均获得巨大涨幅。

@snowboat84: https://x.com/snowboat84/status/2061962883651731602

X AI KOLs Timeline

本文是AI工程全景系列的上篇,从历史角度梳理了GPU从游戏显卡到AI加速器的演化、CUDA的豪赌、谷歌TPU的独立路径,以及英伟达为何最终胜出,详细剖析了芯片、供应链、网络、电力等AI基础设施的底层逻辑。

@dongxi_nlp: 好有价值的文章,最后的 6 条 take away 值得思考。 其中最后两条: 5. 数据行业远未发达。 Anthropic 和 OpenAI为单个环境花费1000万美元以上,而中国 AI 实验室基本上是“自建而非购买”心态。 6. 无数…

X AI KOLs Timeline

文章总结了AI数据行业的现状,指出数据行业尚未成熟,Anthropic和OpenAI为单个环境花费超过1000万美元,而中国AI实验室倾向于自建而非购买;此外,许多实验室虽能使用华为芯片但仍渴望更多英伟达芯片。