开源模型令人难以承受的廉价

Hacker News Top 新闻

摘要

本文探讨了像DeepSeek V4这样的开源模型与Anthropic和OpenAI的闭源模型之间的巨大成本差异,认为后者是通过人为稀缺性和品牌效应而非技术优势来维持高价格。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/25 08:09

# 开源权重模型的难以承受之廉价 – James O'Claire 来源:https://jamesoclaire.com/2026/06/25/the-unbearable-cheapness-of-open-weight-models/ 今天我在配置 Hermes,想看看它在网络研究方面的表现。我选择了 DeepSeek V4,因为我知道它便宜,但当看到它的定价与 Anthropic 和 OpenAI 的“前沿”模型并排时,简直令人咋舌。仅基于 token 数量,价格就相差近 50 倍,更不用说它们的模型在推理时可能陷入多少“思考”(为完成同一任务消耗更多 token)。 让我担心的是,Anthropic 和 OpenAI 似乎把自己逼入了高成本的角落。它们能否合理降价 20-50 倍,以与 DeepSeek 或小米的 Mimo 竞争? ## 开源权重 vs 低成本 这些模型便宜是因为它们是开源权重的,并且有数百人甚至更多人在不同硬件上对其进行了压力测试,从而降低了成本?还是说它们被用作引流产品,以压低价格? ## 如何为商品保持高价? 你制造稀缺性。你销售奢侈品和高端品牌。这正是 OpenAI 和 Anthropic 通过提高“前沿”模型的使用门槛所采取的做法。 这就是奢侈品品牌销售汽车和手袋的一贯方式。它们是富人的俱乐部和身份象征,并不打算广泛分发。 ## Anthropic 和 OpenAI 会借“中国威胁论”来推动开源权重模型的禁令吗? 几个月来我一直担心这一点,而每周的进展似乎都在证实这一点。如何制造稀缺性?一个简单的方法就是散布恐惧,并让政府帮助限制竞争对手的访问。 ## 为什么不竞争? 美国过去是开源的坚定倡导者,我希望严肃的开源竞争能从美国涌现出来,证明开源权重和开源模型最终是未来。 - Google Gemma 4 于 2026 年 4 月发布 - Meta 有 Llama,但一直没有新版本发布 - OpenAI 上次发布开源权重 GPT 模型是在 2025 年 - 据我所知,Anthropic 从未发布过任何开源权重模型 ## 真正开源 vs 开源权重 我认为开源的“跃迁”情景将是真正的开源模型——即训练数据流水线也开源。 https://allenai.org/olmo → 你现在就可以下载这些模型,它们正变得越来越受欢迎。不过,它们的数据截止日期停留在 2024 年 12 月,略显过时。 展望未来,美国国家科学基金会(NSF)与英伟达(Nvidia)合作,支持艾伦人工智能研究所(Allen AI)开发真正完全开放的人工智能:https://www.nsf.gov/news/nsf-nvidia-partnership-enables-ai2-develop-fully-open-ai ## 额外信息: 想深入了解 Claude / ChatGPT 的技术栈?查看它们用于构建 iOS 和 Android 应用的工具: Claude 安卓版(https://appgoblin.info/apps/com.anthropic.claude) ChatGPT 安卓版(https://appgoblin.info/apps/com.openai.chatgpt) 你可以导航到 SDK 部分,查看更详细的组件分解以及未映射的 SDK 路径。

相似文章