GPT 5.5 无法解决这些谜题
摘要
GPT 5.5 未能解决 Jane Street 谜题,而其前身也同样无法应对,这表明人工智能推理能力持续存在局限性。
[Jane Street Puzzles](https://preview.redd.it/lrrv2kgj801h1.png?width=864&format=png&auto=webp&s=2866307b063b7374de00da40e3f0db2c60d7cf21) 你们有人能让它找到解决方案吗?我使用了 GPT 5.5 extended thinking 和 xhigh。也许 pro 可以做到。上个月的问题也解决不了。
相似文章
GPT-5.5 被用于标记 FrontierMath 问题中的致命错误
Epoch 利用 GPT-5.5 识别出 FrontierMath 基准测试中约三分之一的问题存在致命错误,展示了该模型对评估标准进行合理性检查的能力。
GPT-5.4 Thinking 系统卡
OpenAI发布了GPT-5.4 Thinking,这是GPT-5系列中最新推出的推理模型,具备增强的安全缓解措施,尤其值得一提的是,该模型是首个实现全面网络安全保护措施的通用模型。
菲尔兹奖得主数学家蒂莫西·高尔斯使用 GPT5.5 Pro 解决公开问题,认为按照当前进展速度,数学研究很快将面临‘危机’
菲尔兹奖得主蒂莫西·高尔斯报告使用 GPT5.5 Pro 解决公开数学问题,并预测由于人工智能的快速发展,数学研究将很快面临危机。
GPT-5 与数学发现的未来
GPT-5 帮助数学家 Ernest Ryu 解决了一个困扰优化理论40年的开放问题,涉及 Nesterov 加速梯度法的稳定性性质。这一突破展示了大型语言模型通过从数学文献中提取相关技术和思想来辅助重大数学发现的能力。
有人昨天觉得GPT5.5变笨/变懒了吗?
一位运行多个代理的用户报告称,升级到GPT-5.5后,模型突然在执行工具调用方面能力下降,更倾向于给出建议而非实际执行,推测OpenAI可能在进行限流以管理负载。