开源权重模型并非通过抄袭来追赶闭源模型,它们之所以胜出,是因为整个AI堆栈正在悄然模块化
摘要
本文认为,开源权重AI模型追赶闭源模型并非通过蒸馏技术,而是得益于AI堆栈的模块化——稳定的接口(Transformer架构、兼容OpenAI的推理API、智能体框架)使得创新能在整个生态系统中迅速扩散,在缩小能力差距的同时保持巨大的价格优势,最终可能导致前沿AI的商品化。
我读到一篇名为《代币经济学》的文章,它重新诠释了我一直隐约察觉却难以言说的现象。在此分享核心观点,因为我认为它比常规解读更能解释GLM 5.2与Opus 4.8之间的差距:通常解释开源模型为何能跟上步伐的说法是蒸馏——它们是闭源前沿模型的廉价复制品。但本文的主要论点是,这种看法基本错误,真正的驱动力在于AI已经收敛到三个稳定接口:底层的Transformer架构、中间层的兼容OpenAI的推理API、以及上层的智能体框架(如MCP)。一旦拥有稳定接口,就会重现PC行业的故事:英特尔提升芯片,微软改进操作系统,数千家厂商独立创新,由于大家都遵循相同的协议,一方的进步几乎立刻横向扩散给所有人。简言之,无需协调,模块化自动完成工作。本文主张,模型构建现在恰恰处于这种夹层位置:下方是共享架构,中间是共享推理API,上方是共享框架。因此,扩散的是配方,而非权重。旋转位置嵌入、RMSNorm、分组查询注意力、混合专家模型、GRPO——这些技术从发布到进入其他实验室,不过数周时间。将开源MiniMax、Qwen、DeepSeek和Mistral并列比较,你会发现它们几乎共享相同的模块,就像组装一套借来的零件。因此,当GLM 5.2在评测中接近Opus 4.8时,有趣的理解不是“它们抄袭了Opus”,而是前沿不再只是少数实验室可达之地——它已成为整个生态系统的属性,因为构成前沿模型的零件现在已是共享的工业机械。接着看定价:能力差距迅速缩小,但价格差距依然巨大。文章引用了一个智能体测试,MiniMax在类似工作中的速度大约是Opus的5倍,成本低60倍。这不是边际折扣,而是代际差异。文中所做的类比是,一旦Linux加商用x86达到“足够好”的水平,Sun Microsystems便被掏空,RISC/Unix的溢价几乎一夜之间崩溃。如果这种模式成立,那么开源前沿甚至不必击败闭源前沿,只需在特定工作负载上达到“足够好”,该工作负载的溢价便会消失。我真正不确定的是天花板在哪:模块化真的能让开源权重模型一路走到接近AGI的能力,还是前沿的最顶端仍然保持封闭,因为最难的进步不会扩散,而是被垄断?好奇大家认为这个极限在哪。来源:https://x.com/vipulved/status/2071404852908081211
相似文章
开源权重模型正在悄然封闭——这是一个问题
文章认为,开源权重AI模型变得愈发受限的趋势对市场竞争构成了威胁,因为这些模型目前为对抗前沿闭源模型提供商提供了必不可少的价格约束和隐私选项。
[文章] 开放权重模型的论证以及为何我们不能信任 Frontier Labs | provos.org
文章认为,依赖专有的前沿AI API存在风险,因为成本不可预测、可用性变化以及缺乏可审计性,主张开放权重模型是一种更值得信赖的替代方案。
@vipulved: https://x.com/vipulved/status/2071404852908081211
一篇论述AI生态系统正在经历类似PC革命的模块化进程的文章,其中标准化接口(如transformers、推理API和智能体编排框架)促进了专业化和快速创新,而开放权重模型是直接的经济结果。
开源权重难以承受的廉价
讨论了开源权重AI模型变得极其廉价的趋势,使得先进的AI能力更加普及。
我看不出世界各地的政府和企业现在有何理由不在中期内转向开放权重模型。
作者认为,政府和企业将越来越多地转向开放权重的人工智能模型,以避免美国政府对访问权限的控制,并指出开放模型仅稍落后于封闭模型,其发展速度更适合现实世界的官僚体制。