@RayFernando1337: 需要帮助:请数学专家验证问题是否已解决。

X AI KOLs Timeline 新闻

摘要

Kyle Kabasares 声称使用 OpenAI 的 ChatGPT-5.5 Pro 生成了一个候选反例,针对 Don Knuth 的《计算机程序设计艺术》中的一个未解决问题,并请求验证。

需要帮助:请数学专家验证问题是否已解决。
查看原文
查看缓存全文

缓存时间: 2026/06/27 05:51

Kyle Kabasares (@kylekabasares): 我可能让 @OpenAI 的 ChatGPT-5.5 Pro 生成了一个针对唐·克努斯《计算机程序设计艺术》中一个未解决问题的候选反例。

第4卷、第8A分册中的练习210(https://t.co/aAj3vppEsm,第55页)提出了一个关于生成函数分母的问题。

相似文章

我最近使用 ChatGPT 5.5 Pro 的一次体验

Hacker News Top

数学家 Timothy Gowers 讲述了 ChatGPT 5.5 Pro 如何在约一小时内、几乎不需要人工干预的情况下,产出了博士级别的数学研究成果——解决了一篇组合数学/加法数论论文中的若干开放问题。这一经历促使他大幅修正了对大语言模型数学能力的评估。

解决数学应用题

OpenAI Blog

OpenAI 训练了一个使用验证器的系统来解决小学数学应用题,准确率达到儿童水平的 90%,性能几乎是微调后的 GPT-3 的两倍。该方法通过训练验证器来评估候选解决方案并选择最佳方案,解决了语言模型在多步推理中的弱点。