中国AI实验室内部笔记(18分钟阅读)

TLDR AI 新闻

摘要

作者回顾了对中国AI实验室的访问,比较了中国和美国实验室在构建LLM方面的文化差异。中国实验室受益于集体工作和学生参与的文化,而美国实验室则面临个人自我和职业抱负带来的挑战。

从输出和要素来看,中美实验室看起来很相似,但它们在组织和条件上存在重大差异。中国科学家更愿意做不引人注目的工作来改进模型,而不是推销自己的想法。这导致系统更少游戏化,在适应现代技术方面也更灵活。中国AI社区感觉更像一个生态系统,而不是争斗的部落,所有实验室都对同行充满尊重。他们也不太关注技术的商业方面。
查看原文
查看缓存全文

缓存时间: 2026/05/08 18:27

# 来自中国AI实验室内部观察笔记 来源:https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs 坐在从杭州到上海的新型高速列车窗边,我欣赏着夕阳映照下、点缀着风车的壮丽山脊线。山脉构成了辽阔田野与摩天大楼群交织的背景。我怀着极大的谦卑从中国归来。去到一个如此陌生的地方却受到如此热情的欢迎,这是一次非常温暖、人性化的体验。我有幸见到了许多此前只知其名、远在AI生态圈内的人们,他们用灿烂的笑容和热情迎接我,提醒我,我的工作和整个AI生态是多么具有全球性。 那些构建语言模型的中国公司,被打造为这项技术的完美快速追随者,他们建立在长期的教育与工作文化传统之上,并运用了微妙不同的科技公司构建方法。观察其产出——支持智能体工作流程的最新、最大模型,以及其要素——杰出的科学家、大规模数据和加速计算,中国和美国的实验室看起来大同小异。持久的差异体现在这些要素的组织方式和条件塑造上。 我长久以来认为,中国实验室如此擅长追赶并保持前沿优势的一个原因是,它们在文化上契合这项任务。但若不与人们直接交谈,我觉得自己没有资格将显著的影响归因于这个直觉。与中国顶尖实验室里许多优秀、谦逊且开放的科学家交谈后,我的许多信念变得更加清晰。 如今构建最佳LLM的很大一部分工作,归结为对整个技术栈的细致打磨,从数据到架构细节再到RL算法的实现。模型的每个点都可能带来一些改进,而将它们整合在一起是一个复杂的过程,在这个过程中,一些杰出个人的工作可能需要被搁置,以服务于最大化多目标优化的整体模型。 美国的研究人员显然也精通解决各个组件问题,但在美国,有一种更倾向于为自己发声的文化。作为一名科学家,当你为自己的工作发声时会更成功,而现代文化正在推动一条通往“领先AI科学家”名声的新路径。这直接导致了冲突。据传,Llama组织在很大程度上就是因这些利益嵌入层级组织而产生的政治压力而崩溃的。我听说其他实验室提到,有时可能需要付钱给顶尖研究员,以让他们停止抱怨自己的想法未能最终进入模型。无论这是否完全属实,其观点是明确的。自我意识和职业发展欲望确实会阻碍构建最佳模型。中美之间在这种文化上的微小方向性转变,可能对最终成果产生重大影响。 这其中部分原因在于中国是谁在构建模型。所有实验室都存在一个直接现实:很大一部分核心贡献者是活跃的学生。实验室非常年轻,这让我想起了我们在Ai2的架构,学生被视为同伴,直接融入LLM团队。这与美国顶尖实验室截然不同,像OpenAI、Anthropic、Cursor等根本不提供实习机会。其他公司如Google名义上有与Gemini相关的实习,但有很多担忧,担心你的实习会被孤立起来,远离任何实质性的工作。 总结一下,这种文化的细微变化如何能提高构建模型的能力: * 更愿意为了改进最终模型而从事不显眼的工作, * 新进入AI领域的人可以不受之前AI炒作周期的影响,使他们能够更快地适应新的现代技术(事实上,我交谈过的一位中国科学家非常积极地认同这一优势), * 较少的自我意识使得组织架构能轻微扩展,因为系统内的博弈减少了, * 有大量非常适合解决其他地方已有概念验证问题的优秀人才。 这种对构建当今语言模型所需技能的轻微倾向,与一个众所周知的刻板印象形成对比,即中国研究人员倾向于产出较少的创造性、开创领域性的、从0到1的学术型研究。在访问中更具学术性的实验室里,许多领导者谈论培养这种更具雄心的研究文化。同时,我们交谈过的一些技术领导人对这种科学研究方式在短期内是否可能出现持怀疑态度,因为这将需要重新设计教育和激励体系,而这在当前的经济平衡状态下过于庞大,难以实现。这种文化似乎在培养擅长LLM构建游戏的学生和工程师。当然,他们还有极其庞大的人员数量。 这些学生告诉我,中国也发生了类似于美国的人才流失,许多以前考虑学术道路的人现在打算留在工业界。最有趣的引用来自一位研究人员,他曾有兴趣成为教授以接近教育体系,但评论说教育已经被LLM解决了——“学生为什么还要跟我说话!” 学生们的优势在于他们以全新的视角看待LLM。在过去几年里,我们看到LLM的关键范式从扩展MoE,到扩展RL,再到支持智能体。做好其中任何一项都需要快速吸收大量的上下文信息,既包括广泛的文献,也包括你公司的技术栈。学生们习惯于这样做,并且乐于谦逊地放下所有关于什么应该有效的预判。他们全身心投入,奉献自己的生活以争取改进模型的机会。 这些学生还如此神奇地直截了当,摆脱了一些可能分散科学家注意力的哲学讨论。当询问他们如何看待模型的经济性或长期社会风险时,很少有中国研究人员有复杂的观点和推动影响它们的动力。他们的角色是构建最好的模型。 这种差异是微妙的,很容易被否认,但当与一位优雅、才华横溢、能用英语清晰交流的研究人员进行长时间对话时,就能最真切地感受到。关于AI更哲学层面的基本问题,在他们那里会带来简单的困惑。这对他们来说是一个范畴错误。在探讨这些领域时,一位研究人员甚至引用了著名的Dan Wang前提(中国由工程师管理,而美国由律师管理),以强调他们构建的愿望。中国没有能够系统性地促进中国科学家明星力量成长的轨道,类似于像Dwarkesh或Lex那样的大型主流播客。 试图让中国科学家评论由AI驱动的未来经济不确定性、超越简单通用人工智能能力的问题,或者关于模型应如何行为的道德辩论,这些都能捕捉到这些科学家的成长背景和教育经历(edited1 (https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs#footnote-1))。他们极度专注于自己的工作,但成长在一个不鼓励对社会应该如何构建和改变进行辩论和发表意见的体系中。 放眼全局——北京尤其感觉像湾区,一个竞争激烈的实验室就在几步之遥或打车即到的距离。我下了飞机,在去酒店的路上顺便去了阿里巴巴的北京园区。然后,在36小时内,我们访问了智谱AI、月之暗面、清华大学、美团、小米和零一万物。用滴滴出行很方便,如果你在中国选择“XL”车型,常常会配到带按摩座椅的电动小面包车。我们询问了研究人员关于人才争夺战的情况,他们说这和我们美国的情况非常相似。研究人员跳槽很常见,而人们选择去哪里很大程度上取决于当前最好的“氛围”。 在中国,LLM社区感觉更像是一个生态系统,而不是相互争斗的部落。在多次非公开的谈话中,大家充满了对同行的尊重。所有中国实验室都忌惮字节跳动及其受欢迎的豆包模型,这是中国唯一一个前沿的封闭实验室。同时,所有实验室都极度尊重DeepSeek,将其视为在执行层面研究品味最佳的实验室。而在美国,当你与实验室成员进行非公开会面时,火花很容易擦出。 中国研究人员谦逊态度中最引人注目的方面是,他们也经常在商业方面耸耸肩,说那不是他们的问题,而在美国,似乎每个人都沉迷于各种生态系统层面的行业趋势,从数据销售商到计算能力或融资。 分享(https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs?utm_source=substack&utm_medium=email&utm_content=share&action=share) 今天构建AI模型之所以如此有趣,是因为它不仅仅是把一群优秀的研究人员聚集在一栋楼里,创造出工程奇迹。过去或许是如此,但为了维持AI业务,LLM正逐渐成为构建、部署、融资和让这个创造物获得采纳的结合体。领先的AI公司存在于复杂的生态系统中,这些系统提供资金、计算能力、数据等,以持续推动前沿。 对于西方生态系统(以Anthropic和OpenAI为代表),创建和维持LLM所需各种输入的整合已经被很好地概念化和描绘出来。因此,发现中国实验室在思考方式上的巨大差异,有助于指出不同公司可能对未来做出截然不同的押注。当然,这些未来在很大程度上可能受到融资和/或计算能力限制的支配。 我已经记录下与这些实验室交谈后得到的最大“AI行业”层面的收获: 1. **国内AI需求的早期迹象。** 有一个被广泛讨论的假设,即中国AI市场会更小,因为中国公司通常不倾向于为软件付费——因此,无法解锁支持实验室的巨大推理市场。这只适用于映射到SaaS生态系统的软件支出,而SaaS生态系统在中国历史上是微小的。另一方面,中国显然仍然有一个庞大的云市场。一个关键的未解之谜——也是中国实验室自身也在辩论的问题——是企业对AI的支出是跟随SaaS市场的规模(小)还是云市场的规模(基础性)?总的来说,感觉AI更接近云的趋势,没有人积极担心围绕新工具的市场增长。 2. **大多数开发者是Claude的信徒。** 中国的大多数AI开发者都痴迷于Claude,以及它如何改变了他们构建软件的方式,尽管Claude名义上在中国是被禁止的。仅仅因为中国历史上对购买软件犹豫不决,并没有给我留下推理需求不会激增的印象。中国的技术人员非常务实、谦逊且有动力——这一事实似乎比任何过去不花钱的习惯承诺都更强大。一些中国研究人员提到使用自己的工具进行构建,例如Kimi或GLM的CLI,但*所有*人都提到使用Claude进行构建。令人惊讶的是,很少有人提到Codex,而它在湾区肯定越来越受欢迎。 3. **中国公司具有技术所有权心态。** 中国文化与轰鸣的经济引擎相结合,正在产生不可预测的结果。我留下了一个持久的印象:众多的AI模型反映了这里许多科技企业的一种实用、当前的均衡状态。没有总体规划。这个行业的特征是对字节跳动和阿里巴巴的尊重,这些现有巨头凭借其雄厚的资源有望赢得所有市场的很大份额。DeepSeek是备受尊敬的技术领导者,但远非市场领导者。他们设定了方向,但并未被设定为在经济上取胜。这给像美团 (https://huggingface.co/meituan-longcat/LongCat-Next) 或蚂蚁集团 (https://huggingface.co/inclusionAI/Ling-2.6-1T) 这样的公司留下了空间,西方人可能会惊讶它们也在构建这些模型。实际上,它们显然将LLM视为未来技术产品的核心,因此需要一个强大的基础。当他们微调强大的通用模型时,这强化了他们的技术栈,通过让开放社区提供反馈来完善它,并且他们可以为自己的产品保留内部的、微调后的模型版本。行业中“开放优先”的心态很大程度上是由实用性定义的——它有助于让他们的模型获得强有力的反馈,回馈开源社区,并赋能他们的使命。 4. **政府援助是真实的,但规模尚不清楚。** 人们经常断言中国政府正在积极帮助这场开放LLM竞赛。这是一个权力下放到多个层级的政府,每个层级对于自己具体做什么并没有明确的指导手册。北京的各个区域都在竞争,以吸引科技公司入驻。提供给这些公司的“帮助”几乎肯定涉及消除官僚主义的繁文缛节(如许可证),但这种帮助能走多远?各级政府能帮助吸引人才吗?能帮助走私芯片吗?在整个访问过程中,多次提到政府的兴趣或帮助,但细节太少,无法断言或形成关于政府如何能影响中国AI发展轨迹的自信世界观。当然,没有任何迹象表明中国最高层级的政府会干预模型中的任何技术决策。 5. **数据行业远不发达。** 听到很多关于像Anthropic或OpenAI为单个环境花费超过1000万美元,每年累计花费数亿美元来推动RL前沿的传闻后,我们渴望知道中国实验室是否从美国公司购买相同的环境,或者有一个镜像的国内生态系统支持。答案并不完全是没有数据行业,而是他们的经验是数据行业质量相对较差,通常最好内部构建环境或数据。研究人员自己也花费大量时间来构建RL训练环境,而像字节跳动和阿里巴巴这样的一些大公司则有内部数据标注团队来支持这一点。这一切都呼应了前一点中的“构建而非购买”的心态。 6. **对更多Nvidia芯片的渴望。** Nvidia计算是训练的黄金标准,每个人的进步都因没有更多芯片而受限。如果供应充足,显然他们会购买。其他加速器,包括但不限于华为的芯片,在推理方面的应用评价是积极的。无数的实验室可以接触到华为的芯片。 这些观点描绘了一个截然不同的AI生态系统图景,试图快速将西方实验室的运作方式映射到中国同行身上往往会导致范畴错误。关键问题是,这些不同的生态系统是否会产生意义截然不同的模型类型,或者中国模型是否总是被解释为与美国3-9个月前的前沿模型相似。 去之前我对中国知之甚少,回来后感觉才刚刚开始学习。中国不是一个可以用规则或配方来表达的地方,而是一个具有非常不同动态和化学反应的所在。它的文化如此古老、深邃,并且仍然完全交织在本地技术如何构建之中。我还有很多东西要学。 目前如此巨大的力量

相似文章

@MaxForAI: 一个刚在浙大读完CS硕士的日本人,写了一篇《中国AI为什么发展》,比很多中文互联网的自嗨分析更接近现实。 它的核心不是夸中国,也不是骂日本,而是指出一个很朴素的事实: 中国AI人才不是凭空出现的,而是被一整套残酷但有效的系统训练出来的。 …

X AI KOLs Timeline

一位曾在浙江大学读完CS硕士的日本人撰文分析中国AI人才体系的运作机制,指出中国AI发展依靠的是从高考到研究生的高强度筛选和系统化训练,而非奇迹。文章还涉及GPU管制、华为芯片现状等观察。