关于 GPT-5.5 的效率,我是不是漏看了什么?
摘要
一位用户质疑 Codex 中 GPT-5.5 相较于 GPT-5.4 的 Token 效率,分析了 Artificial Analysis 的图表,并称赞了 Cursor 的 Token 表现。
相似文章
GPT-5.5s 思维链在新版 Codex 更新中持续泄漏。看来我们明白了他们如何实现令牌效率,他们是彻底压榨到了极致。
文章指出,GPT-5.5 的思维链机制在新版 Codex 更新中出现泄漏,这表明其令牌效率的提升源于过度的优化。
GPT-5.5 或许消耗更少的 token,但它始终烧掉更多的钱
尽管 OpenAI 声称 GPT-5.5 在 token 效率上有所提升,但实际使用成本仍比 GPT-5.4 高出 49% 至 92%;与此同时,Anthropic 的 Claude Opus 4.7 对于较长提示词的实际成本也上涨了 12% 至 27%。这一现象反映出前沿模型价格普遍上涨的趋势,而两家公司均面临巨额预计亏损。
@omarsar0: 效率前沿!你认为 GPT-5.6 会落在哪里?
讨论 Claude Opus 4.8 和 GPT-5.5 在 DeepSWE Bench 上的最新基准测试结果,并推测未来 GPT-5.6 的性能和效率趋势。
介绍 GPT-5.4
# 介绍 GPT-5.4 Source: [https://openai.com/index/introducing-gpt-5-4/](https://openai.com/index/introducing-gpt-5-4/) 今天,我们在 ChatGPT(作为 GPT‑5\.4 Thinking)、API 和 Codex 中发布 **GPT‑5\.4**。它是我们用于专业工作的最强大、最高效的前沿模型。我们还将在 ChatGPT 和 API 中发布 **GPT‑5\.4 Pro**,适合希望在复杂任务上获得极致性能的用户。GPT‑5\.4 融合了我们近期在推理、编码和智能体方面的最佳进展。
利用 GPT-5.1-Codex-Max 构建更多
OpenAI 推出 GPT-5.1-Codex-Max,这是一款新的智能代理编码模型,具有改进的推理能力、token 效率,以及通过“压缩”机制在数百万个 token 上保持连贯工作的能力。该模型更快速、更智能,可以持续运行数小时甚至数天的长时间任务,代表了 AI 辅助软件工程的重大进步。