GPT 5.6 Sol 与 Claude Mythos 遭遇了相同的命运。到底发生了什么?
摘要
OpenAI 发布了 GPT-5.6,但仅向美国政府批准的客户开放访问权限,引发了对依赖专有 API 的担忧。文章主张使用开源替代方案构建内部精调模型,以保持控制并降低成本。
OpenAI 刚刚发布了他们的最新模型 GPT-5.6,但问题来了。他们只将其发布给美国政府批准的公司。白宫实际上正在逐个审查客户,决定谁能在前两周内获得访问权限,然后其他人才能使用。Sam Altman 本人告诉他的员工,这“不是我们偏好的长期模式”。所以就连他自己也对此感到不安。但这就是目前的情况。这正是我一直强调每家公司都需要拥有自己模型的原因。你不能再完全依赖 OpenAI 或 Anthropic 了。如果政府明天决定只有某些公司才能访问最新模型,你的整个产品就会崩溃。你无法发布新功能,无法竞争,你的路线图不再由你掌控。好消息是,运行自己模型的成本正在快速下降。GPU 越来越便宜。像 Cerebras、Fireworks、Groq、SambaNova 这样的公司都在竞争,每月都在降价。现在你可以用过去一份 OpenAI API 账单的费用租到强大的计算资源。因此经济上已经可行。而开源模型——Qwen、Llama、Mistral、DeepSeek——在大多数实际企业任务上的质量已经非常接近 GPT-4。差距比人们想象的要小得多。一旦你在自己的数据上针对自己的用例对其中一个模型进行微调,它实际上会在你的特定问题上击败闭源模型。因为闭源模型是通用的,而你微调后的模型是为你的具体需求量身定制的。最近我为一家 RAG 公司构建了这样的系统。我们采用了 Qwen,在其领域数据上进行微调,添加了负例数据集来训练模型说“我不知道”而不是产生幻觉,并将其部署在混合架构上。常态流量使用本地 GPU,大负载时租用云端 GPU。结果真的比我预期的要好。幻觉率从大约 14% 降至 2% 以下。每 100 万次查询相比使用云 API 每月节省 15,600 美元。数据完全不离开客户网络。在一张 H100 上支持 60 并发用户,响应时间低于 2 秒。而最重要的部分来了。我们拥有一个数据飞轮。每一次查询、每一次修正、每一次有人说“这个答案错了,正确答案是 X”,所有这些都会反馈到下一轮微调中。因此模型在特定用例上不断进步。每周、每月都在提升。他们的竞争对手根本无法复制这一点,因为他们没有客户关系或数据。这才是真正的护城河。不是模型。模型正在变成商品。数据和飞轮才是别人无法从你手中夺走的东西。所以当本周新闻说“GPT-5.6 仅限政府批准的客户”时,我们的客户甚至没有注意到。他们的产品在 6 月 24 日和 6 月 25 日运行完全一样。这就是拥有自己技术栈的全部意义。如果你现在正在构建任何 AI 产品,并且仍然完全依赖 OpenAI 或 Anthropic 的 API,那么本周就是一个警钟。建立你自己的模型,微调它,设置好飞轮。供应商最终会自己解决,但你不能把公司押注在他们身上。
相似文章
OpenAI在政府要求后限制GPT-5.6的推出,表示限制不应成为常态
OpenAI应美国政府要求,以安全为由将其GPT-5.6模型(Sol、Terra、Luna)的推出限制在一小群可信合作伙伴范围内。该公司认为这不应成为长期常态,并正在与政府合作制定新的框架。
OpenAI 在美国 AI 监管风波中发布 GPT-5.6
OpenAI 发布了 GPT-5.6,这是一个包含 Sol、Terra 和 Luna 的新模型系列,在编码、网络安全和自主任务方面性能提升,同时面临美国加强的监管审查。
如果GPT-5.6首先获得政府批准的访问权限,开放权重就不再是可选项了
美国政府要求OpenAI将GPT-5.6的初始发布限制在少量政府批准的合作伙伴范围内,这引发了关于创造前沿AI访问权限俱乐部的担忧。此政策可能推动开发者转向开放权重模型,并有可能将开发者生态系统拱手让给中国实验室。
Mythos是第一个,现在是GPT-5.6
OpenAI应政府要求限制GPT-5.6的发布,引发关于IPO炒作或战略失误的猜测,并对本地大模型及中国AI格局产生影响。
@mattshumer_: 政府正在引导我们走向一条非常危险的道路。这将严重加剧不平等。
OpenAI 宣布了 GPT-5.6 Sol 的有限预览,这是一个新一代前沿模型,同时推出了 GPT-5.6 Terra 和 GPT-5.6 Luna,以实现高效且经济实惠的工作。