开源权重模型并非通过抄袭来追赶闭源模型,它们之所以胜出,是因为整个AI堆栈正在悄然模块化

Reddit r/singularity 新闻

摘要

本文认为,开源权重AI模型追赶闭源模型并非通过蒸馏技术,而是得益于AI堆栈的模块化——稳定的接口(Transformer架构、兼容OpenAI的推理API、智能体框架)使得创新能在整个生态系统中迅速扩散,在缩小能力差距的同时保持巨大的价格优势,最终可能导致前沿AI的商品化。

我读到一篇名为《代币经济学》的文章,它重新诠释了我一直隐约察觉却难以言说的现象。在此分享核心观点,因为我认为它比常规解读更能解释GLM 5.2与Opus 4.8之间的差距:通常解释开源模型为何能跟上步伐的说法是蒸馏——它们是闭源前沿模型的廉价复制品。但本文的主要论点是,这种看法基本错误,真正的驱动力在于AI已经收敛到三个稳定接口:底层的Transformer架构、中间层的兼容OpenAI的推理API、以及上层的智能体框架(如MCP)。一旦拥有稳定接口,就会重现PC行业的故事:英特尔提升芯片,微软改进操作系统,数千家厂商独立创新,由于大家都遵循相同的协议,一方的进步几乎立刻横向扩散给所有人。简言之,无需协调,模块化自动完成工作。本文主张,模型构建现在恰恰处于这种夹层位置:下方是共享架构,中间是共享推理API,上方是共享框架。因此,扩散的是配方,而非权重。旋转位置嵌入、RMSNorm、分组查询注意力、混合专家模型、GRPO——这些技术从发布到进入其他实验室,不过数周时间。将开源MiniMax、Qwen、DeepSeek和Mistral并列比较,你会发现它们几乎共享相同的模块,就像组装一套借来的零件。因此,当GLM 5.2在评测中接近Opus 4.8时,有趣的理解不是“它们抄袭了Opus”,而是前沿不再只是少数实验室可达之地——它已成为整个生态系统的属性,因为构成前沿模型的零件现在已是共享的工业机械。接着看定价:能力差距迅速缩小,但价格差距依然巨大。文章引用了一个智能体测试,MiniMax在类似工作中的速度大约是Opus的5倍,成本低60倍。这不是边际折扣,而是代际差异。文中所做的类比是,一旦Linux加商用x86达到“足够好”的水平,Sun Microsystems便被掏空,RISC/Unix的溢价几乎一夜之间崩溃。如果这种模式成立,那么开源前沿甚至不必击败闭源前沿,只需在特定工作负载上达到“足够好”,该工作负载的溢价便会消失。我真正不确定的是天花板在哪:模块化真的能让开源权重模型一路走到接近AGI的能力,还是前沿的最顶端仍然保持封闭,因为最难的进步不会扩散,而是被垄断?好奇大家认为这个极限在哪。来源:https://x.com/vipulved/status/2071404852908081211
查看原文

相似文章

@vipulved: https://x.com/vipulved/status/2071404852908081211

X AI KOLs Following

一篇论述AI生态系统正在经历类似PC革命的模块化进程的文章,其中标准化接口(如transformers、推理API和智能体编排框架)促进了专业化和快速创新,而开放权重模型是直接的经济结果。