标签
Kimi K2.7 Code 是一款新AI模型,据称在涉及物理模拟的代码生成任务中,性能达到GPT-5.5级别,但成本仅为其三倍更便宜。
Sentra的Code Memory系统将GPT-5.5在Terminal-Bench 2.1上的性能提升至88.31%,而成本仅为四分之一,超越了Anthropic受限的Mythos 5模型。该记忆层减少了52%的输入Token,成本降低了72.6%,同时提升了任务成功率。
OpenAI 正在准备一款代号为 5.6 的新 AI 模型,据称相比 GPT-5.5 有显著改进,同时该公司的 IPO 时间线可能受到 AI 快速进步和算力需求的影响。
据报道,DeepSeek V4 Pro 在精确度上优于 GPT-5.5 Pro,这标志着模型准确性方面的重大进步。
OpenAI停止了对gpt-5.3-codex模型的支持,影响了OpenClaw用户,他们现在需要通过Codex切换到gpt-5.5模型。
Codex已达500万用户,正准备重置限制,提到了GPT 5.5和快速模式。
Braintrust 使用 OpenAI 的 Codex 与 GPT-5.5,在几分钟内将客户功能请求转化为预览分支,实现实时迭代和更快的反馈循环。
用户报告OpenAI的Codex GPT-5.5 high模型表现下降,出现懒惰、胡说八道和上下文丢失等问题,怀疑是OpenAI正在训练GPT-5.6所致,需开启xhigh模式才能恢复正常。
一条推文强调,Tembo提供的20个免费日额度可完全访问GPT 5.5和GLM,而Opus 4.7可以零成本处理架构任务,其输出与付费工具相当。
Codex宣布了一个周末黑客马拉松的获胜者,参与者使用GPT-5.5和Codex构建项目,奖品包括ChatGPT Pro订阅。
OpenAI 正在为美国 Pro 用户预览 ChatGPT 中的个人理财体验,用户可以安全地连接金融账户、查看仪表板,并询问基于上下文的金融问题,该功能由 GPT-5.5 提供支持。
作者解释他们跳过Codex的规划模式,而是通过聊天对话达成一个伪计划,然后实施。
一位运行多个代理的用户报告称,升级到GPT-5.5后,模型突然在执行工具调用方面能力下降,更倾向于给出建议而非实际执行,推测OpenAI可能在进行限流以管理负载。
NVIDIA 的工程师和研究人员正在使用由 GPT-5.5 驱动的 OpenAI Codex,作为处理复杂工程任务和端到端机器学习工作流的默认工具。本文重点介绍了通过在该 NVIDIA 基础设施上集成 Codex 所取得的显著生产力提升、自主系统构建以及研究自动化成果。
Report claims that GPT-5.5 Instant shows significant improvements in factual accuracy, particularly in high-stakes fields like medicine, law, and finance.
一个教程视频,展示如何使用OpenAI的Codex和GPT-5.5进行'氛围编程',无需传统编码即可构建Web、桌面和iOS应用程序,包括Firebase集成和Vercel部署。
Simon Willison 评估了 OpenAI 的 GPT-5.5 在网络任务中的表现,考察了其在网络安全领域的能力。
OpenAI 发布了 GPT-5.5,这是其前沿 AI 模型的重大升级,在保持高效与速度的同时,在智能体编码、研究以及多步骤任务执行等方面具备更强的能力。
一位用户在 OpenAI Codex 短暂泄露期间,录下了包含 GPT-5.5、Arcanine、Glacier-alpha 等多款未发布内部模型的下拉列表,随后界面被迅速修复。
User testing indicates the new 5.4 Pro model is actually a disguised 5.5-thinking-xhigh, suggesting OpenAI is quietly rolling out stronger reasoning capabilities to Pro subscribers.