开源模型令人难以承受的廉价
摘要
本文探讨了像DeepSeek V4这样的开源模型与Anthropic和OpenAI的闭源模型之间的巨大成本差异,认为后者是通过人为稀缺性和品牌效应而非技术优势来维持高价格。
暂无内容
查看缓存全文
缓存时间: 2026/06/25 08:09
# 开源权重模型的难以承受之廉价 – James O'Claire
来源:https://jamesoclaire.com/2026/06/25/the-unbearable-cheapness-of-open-weight-models/
今天我在配置 Hermes,想看看它在网络研究方面的表现。我选择了 DeepSeek V4,因为我知道它便宜,但当看到它的定价与 Anthropic 和 OpenAI 的“前沿”模型并排时,简直令人咋舌。仅基于 token 数量,价格就相差近 50 倍,更不用说它们的模型在推理时可能陷入多少“思考”(为完成同一任务消耗更多 token)。
让我担心的是,Anthropic 和 OpenAI 似乎把自己逼入了高成本的角落。它们能否合理降价 20-50 倍,以与 DeepSeek 或小米的 Mimo 竞争?
## 开源权重 vs 低成本
这些模型便宜是因为它们是开源权重的,并且有数百人甚至更多人在不同硬件上对其进行了压力测试,从而降低了成本?还是说它们被用作引流产品,以压低价格?
## 如何为商品保持高价?
你制造稀缺性。你销售奢侈品和高端品牌。这正是 OpenAI 和 Anthropic 通过提高“前沿”模型的使用门槛所采取的做法。
这就是奢侈品品牌销售汽车和手袋的一贯方式。它们是富人的俱乐部和身份象征,并不打算广泛分发。
## Anthropic 和 OpenAI 会借“中国威胁论”来推动开源权重模型的禁令吗?
几个月来我一直担心这一点,而每周的进展似乎都在证实这一点。如何制造稀缺性?一个简单的方法就是散布恐惧,并让政府帮助限制竞争对手的访问。
## 为什么不竞争?
美国过去是开源的坚定倡导者,我希望严肃的开源竞争能从美国涌现出来,证明开源权重和开源模型最终是未来。
- Google Gemma 4 于 2026 年 4 月发布
- Meta 有 Llama,但一直没有新版本发布
- OpenAI 上次发布开源权重 GPT 模型是在 2025 年
- 据我所知,Anthropic 从未发布过任何开源权重模型
## 真正开源 vs 开源权重
我认为开源的“跃迁”情景将是真正的开源模型——即训练数据流水线也开源。
https://allenai.org/olmo → 你现在就可以下载这些模型,它们正变得越来越受欢迎。不过,它们的数据截止日期停留在 2024 年 12 月,略显过时。
展望未来,美国国家科学基金会(NSF)与英伟达(Nvidia)合作,支持艾伦人工智能研究所(Allen AI)开发真正完全开放的人工智能:https://www.nsf.gov/news/nsf-nvidia-partnership-enables-ai2-develop-fully-open-ai
## 额外信息:
想深入了解 Claude / ChatGPT 的技术栈?查看它们用于构建 iOS 和 Android 应用的工具:
Claude 安卓版(https://appgoblin.info/apps/com.anthropic.claude)
ChatGPT 安卓版(https://appgoblin.info/apps/com.openai.chatgpt)
你可以导航到 SDK 部分,查看更详细的组件分解以及未映射的 SDK 路径。
相似文章
开源权重难以承受的廉价
讨论了开源权重AI模型变得极其廉价的趋势,使得先进的AI能力更加普及。
[文章] 开放权重模型的论证以及为何我们不能信任 Frontier Labs | provos.org
文章认为,依赖专有的前沿AI API存在风险,因为成本不可预测、可用性变化以及缺乏可审计性,主张开放权重模型是一种更值得信赖的替代方案。
开源权重模型正在悄然封闭——这是一个问题
文章认为,开源权重AI模型变得愈发受限的趋势对市场竞争构成了威胁,因为这些模型目前为对抗前沿闭源模型提供商提供了必不可少的价格约束和隐私选项。
开放和封闭模型处于不同的指数曲线上(8分钟阅读)
本文分析了开放和封闭AI模型之间的经济分化,认为高级封闭模型将通过优越的智能(尤其是编码代理)保持高利润率,而开放模型则遵循商品化和效率的不同轨迹。
⚡️ Anthropic与OpenAI的订阅亏损远超预期
SemiAnalysis的新分析显示,Anthropic和OpenAI的订阅服务亏损远超此前估计,通过API使用其AI模型的真实成本比订阅费用高出数个数量级。