@RayFernando1337: 需要帮助:请数学专家验证问题是否已解决。
摘要
Kyle Kabasares 声称使用 OpenAI 的 ChatGPT-5.5 Pro 生成了一个候选反例,针对 Don Knuth 的《计算机程序设计艺术》中的一个未解决问题,并请求验证。
查看缓存全文
缓存时间: 2026/06/27 05:51
Kyle Kabasares (@kylekabasares): 我可能让 @OpenAI 的 ChatGPT-5.5 Pro 生成了一个针对唐·克努斯《计算机程序设计艺术》中一个未解决问题的候选反例。
第4卷、第8A分册中的练习210(https://t.co/aAj3vppEsm,第55页)提出了一个关于生成函数分母的问题。
相似文章
@wtgowers: 我也开始尝试让 AI 解决数学中的开放性问题。更准确地说,我把 Melvyn Nathanson 提出的几个问题提交给了 ChatGPT 5.5 Pro……
Tim Gowers 报告称,他使用 ChatGPT 5.5 Pro 尝试解决由 Melvyn Nathanson 提出的数学开放性问题。
我最近使用 ChatGPT 5.5 Pro 的一次体验
数学家 Timothy Gowers 讲述了 ChatGPT 5.5 Pro 如何在约一小时内、几乎不需要人工干预的情况下,产出了博士级别的数学研究成果——解决了一篇组合数学/加法数论论文中的若干开放问题。这一经历促使他大幅修正了对大语言模型数学能力的评估。
解决数学应用题
OpenAI 训练了一个使用验证器的系统来解决小学数学应用题,准确率达到儿童水平的 90%,性能几乎是微调后的 GPT-3 的两倍。该方法通过训练验证器来评估候选解决方案并选择最佳方案,解决了语言模型在多步推理中的弱点。
ChatGPT 的图像模型在数学方面优于大多数人
文章指出,ChatGPT 的图像模型在数学推理能力方面优于大多数人类。
OpenAI 声称解决了80年前的数学难题——这次是真的
OpenAI 声称其新推理模型自主生成了一个原创数学证明,推翻了保罗·埃尔德什(Paul Erdős)一个80年未解的几何猜想。这标志着人工智能首次解决了一个数学领域核心的著名开放问题。