人工智能与数学的未来(2分钟阅读)
摘要
Grant Sanderson 与 Dwarkesh Patel 探讨了人工智能在数学领域的快速进展、概念突破的本质,以及随着AI的进步这对其他领域意味着什么。
在本次与 Dwarkesh Patel 的播客访谈中,3Blue1Brown 的创作者 Grant Sanderson 讨论了人工智能在数学领域快速但不均衡的进展如何为它未来将如何转型更广泛的经济提供了路线图。Sanderson 指出,虽然AI可以快速暴力求解几何等领域,但它在处理需要深度概念创造力的趣味组合数学问题时仍然困难。
查看缓存全文
缓存时间: 2026/07/01 17:19
# Grant Sanderson – AI 与数学的未来
来源:https://www.dwarkesh.com/p/grant-sanderson-2
与Grant (https://3blue1brown.substack.com/)聊天总是乐趣无穷。
AI 在数学领域的进展远比在其他领域快得多。因此,数学正在非常具体地向我们展示,AI 在其他领域的进展将会是什么样子。即使在数学内部,也存在一个参差不齐的景观。那会是什么样的?
数学史上最重要的概念突破的本质是什么?它们与当前 AI 所能做到的事情有多大不同?
AI(净计)是增加还是减少了人类对该领域的理解?
让 AI 系统性地尝试连接文献中已有的想法,这个“悬而未决”的潜力有多大?
对于那些对正被 AI 深刻变革的领域充满热情的有志数学家、程序员和其他学生,Grant 有什么建议?
在YouTube (https://youtu.be/TfyPshgMbug)观看;在Apple Podcasts (https://podcasts.apple.com/us/podcast/grant-sanderson-ai-and-the-future-of-math/id1516093381?i=1000774870615)或Spotify (https://open.spotify.com/episode/0X3t4uRlpVT4MXPYDIrNYX?si=HZf_0Ky2Q42tOWYZNvWi6w)收听。
- Gemini 3.5 Live Translate (https://ai.studio/live) 是我上次去中国时希望能拥有的工具。它能检测超过70种语言并近乎实时地翻译……而且能保留你原始的语速和语调。如果你正在构建一个需要实时翻译的应用,你应该看看 Gemini 3.5 Live Translate。从ai.studio/live (https://ai.studio/live)开始。
- Cursor (https://cursor.com/dwarkesh) 的框架让我能在播客中使用模型完成各种任务。例如,Cut out the ads from each episode I produce so I can post them on Bilibili. It also helps me prep for interviews — I have a repo full of books and papers that Cursor sorts through to find the exact right file for any given question. Try Cursor yourself atcursor.com/dwarkesh (https://cursor.com/dwarkesh)
- Jane Street (https://janestreet.com/dwarkesh) 赞助了 3Blue1Brown,所以 Grant 有很多机会与各种 Jane Street 的人交流。他实际上刚刚与其中几位录制了一期访谈,所以当我们坐下来录制这一集时,他告诉我他学到的一些东西,比如 Jane Street 如何保持角色定义的模糊性,以确保员工不断学习和成长。去 3b1b.co/janestreet (https://3b1b.co/janestreet) 看看 Grant 的完整访谈。
(00:00:00) – AI 正在发现新的证明。这是 AGI 吗?
(00:11:32) – 概念突破的验证循环可能长达一个世纪
(00:26:12) – 我们能理解 AI 对黎曼猜想的证明吗?
(00:38:08) – AI 能找到领域间隐藏的桥梁吗?
(00:53:48) – 为什么现实世界的任务不适合强化学习环境
(01:07:07) – 好的写作需要 AI 仍然缺乏的心智理论
(01:16:02) – 为什么学习仍然取决于人类的筛选
**Dwarkesh Patel**
今天,我和Grant Sanderson (https://x.com/3blue1brown?lang=en)聊天,他运营着3Blue1Brown (https://en.wikipedia.org/wiki/3Blue1Brown),目前正在从事一个新项目,记录 AI 在数学领域取得的进展。我想和你谈谈这个,因为 AI 在数学领域的进展是所有领域中最快的。无论这里发生了什么,无论我们看到 AI 进展以何种方式发生或不发生,都将告诉我们随着 AI 变得更好,世界其他地方会发生什么。
我想从这个问题开始,我在三年前第一次采访你时(https://www.dwarkesh.com/p/grant-sanderson)就问过你。我问你,一旦我们有了能在国际数学奥林匹克竞赛(https://en.wikipedia.org/wiki/International_Mathematical_Olympiad)中获得金牌(https://rits.shanghai.nyu.edu/ai/ai-wins-gold-at-2025-international-mathematical-olympiad/)的 AI,难道这不就是 AGI 吗?考虑到这些问题的难度,难道不是它能做任何人类能做的事情吗?
你当时有一个答案,事后看来非常明智和正确。你说这将是另一个基准,就像 AI 正在通过的所有其他基准一样。显然,自那以后 AI 在通用能力上有所提升,但当这发生时,不会有什么“啊哈”时刻。
首先,我很好奇你对此的启发式思考,为什么这被证明是正确的。其次,我好奇你认为这种狭窄性还能持续多久。到 AI 解决了一个千禧年大奖难题(https://en.wikipedia.org/wiki/Millennium_Prize_Problems)的时候,你认为是否仍然可能存在大量人类在做而 AI 在经济中无法自动化完成的任务?
**Grant Sanderson**
这是个有趣的问题,因为在不知道解决方案是什么样之前很难回答。就拿 IMO 来说,你三年前问题的主旨在于看到这些问题的一些解决方案似乎确实需要创造力。这些问题的设计者试图提出一些你无法轻易训练就能应对的题目。
但 IMO 的一个小秘密是,你真的可以为很多题目进行训练。正如你指出的,随着 AI 和数学项目的全面展开,它之所以有趣的部分原因在于 AI 有一个尖峰前沿,而数学正好处于其中一个尖峰上。
但这种尖峰性具有分形特征,因为当你放大数学内部的特定进展时,有些事情比其他事情容易得多。如果我们只考虑 IMO,现在这已经是旧闻了。自它们表现相当不错以来已经两年了。如果不是因为以下原因,它们在 2024 年本可以获得金牌。它们非常出色。它们基本就是直接硬解了几何题(https://www.youtube.com/watch?v=4NlrfOl0l8U)。IMO 有四类问题:几何、数论(https://en.wikipedia.org/wiki/Number_theory)、代数和组合数学(https://en.wikipedia.org/wiki/Combinatorics)。几何(https://deepmind.google/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/),自 2024 年起它可以在 19 秒内解决,因为它是一个暴力求解器。
小秘密是:对学生来说,也有一种暴力方法可以应对。组合数学是未知数:问题看起来更富有玩乐性和谜题性。那年的考试中有两道组合数学题,但这并不总是发生。有四个类别和六个不同的问题,所以哪个类别会有两个问题是不确定的。如果几何题更多,它们那年就能拿金牌。
但它在那些组合数学题上很挣扎。那些试图保持数学最后堡垒火炬的人可能会说,那些题目需要更多创造力。即便如此,你问题的精神——如果它们解决了一个千禧年大奖问题,那是否也能服务于大量白领工作?——暗示无论我们现在与那个目标之间存在什么速率限制因素,都与使白领工作变得更好的速率限制因素相同。
我们可以描绘几种不同的方式。如果我们关注黎曼假设(https://en.wikipedia.org/wiki/Riemann_hypothesis),解决它会是什么样子?这些东西非常擅长特定的知识领域,深入了解,然后了解另一个领域,再另一个。你指出过这一点。拥有一个具有超人般广度、对所有领域都了如指掌,但却找不到连接它们的闪电般灵感的东西,这很奇怪。
我认为我们开始看到它在其专长的领域之间建立联系的苗头。我肯定我们会谈到这个。如果黎曼假设解决方案的性质是那样的话,在我看来,这与做好白领工作所需的能力截然不同。
我们有理由相信这可能就是解决方案的性质。我不知道你是否了解Hugh Montgomery 和 Freeman Dyson 在 IAS 的故事(https://www.ias.edu/ideas/2013/primes-random-matrices)。这是个题外话,但很有趣。我不确定是不是在午餐时发生的,总之有一位数论学家试图理解黎曼ζ函数(https://youtu.be/sD0NjbwqlYw)零点对之间的统计相关性(https://en.wikipedia.org/wiki/Montgomery%27s_pair_correlation_conjecture)。
黎曼假设全在于这些零点是否都位于一条直线上。他找到了一个可以量化的提问方式,并写下了一个公式。看起来像是 1/sin^2 之类的。物理学家 Freeman Dyson (https://en.wikipedia.org/wiki/Freeman_Dyson) 说:“我知道那个表达式。那个表达式出现在研究随机厄米特矩阵(https://en.wikipedia.org/wiki/Hermitian_matrix)的特征值(https://en.wikipedia.org/wiki/Eigenvalues_and_eigenvectors)时”,而这在研究原子核能级时会出现。
这两个看似不同的事物在统计上相同这一想法,促使人们探索随机矩阵理论(https://en.wikipedia.org/wiki/Random_matrix)的某些方面是否可能与黎曼ζ函数(https://en.wikipedia.org/wiki/Riemann_zeta_function)相关。我认为这是个悬而未决的问题,不知道是否能从中得到成果。但将这两个不同领域连接起来——如果黎曼假设的解决方案是更深入地探索类似的想法——这正符合人们期望LLMs (https://en.wikipedia.org/wiki/Large_language_model) 在数学上擅长的特性。它们是量子物理(https://en.wikipedia.org/wiki/Quantum_mechanics)的专家。它们是解析数论(https://en.wikipedia.org/wiki/Analytic_number_theory)的专家。它们应该能够看到这种相似性,而不需要 Montgomery (https://en.wikipedia.org/wiki/Hugh_Lowell_Montgomery) 和 Dyson 在午餐时碰巧谈论它。这与白领工作完全不同。如果你很难将 AI 用作编辑,不是因为它什么都知道而只需要它找到其中的闪电灵感。
另一种可能性是……用什么类比好呢?也许想想费马(https://en.wikipedia.org/wiki/Fermat%27s_Last_Theorem) 大定理(https://en.wikipedia.org/wiki/Fermat%27s_Last_Theorem) ,从费马提出问题的时刻到解决方案本身的样子,解决方案最终涉及如此庞大的数学机制。这个问题之美在于你可以表述得非常简单。你问 *x^n* + *y^n* = *z^n*。当 *n* 大于 3 时,是否有整数解?
你可能会期望有一种初等数论的方法,但就目前所知,并没有。而实际的解决方案,也许有更简单的,但这可能就是它必须的样子。有一套非常复杂的思想,建立在几个世纪围绕椭圆曲线(https://en.wikipedia.org/wiki/Elliptic_curve)的工作之上。然后还有另一大堆思想,围绕着称为模形式(https://en.wikipedia.org/wiki/Modular_form)的东西。这两座山都必须先建好,才能提出连接它们的正确问题。
如果黎曼假设的解决方案涉及建造一座新山,那是一种技巧——提出正确新思想的能力——这感觉与它们当前智能的特征足够不同。这倒不完全是你从雇佣的视频编辑那里所需要的那种能力。但如果它能够建造出正确的、结晶化我们应如何思考某一主题的新理论之山,那简直是如此高的智能水平,以至于如果它不渗透到经济其他方面(而不仅仅是数学自身的造山运动),那才奇怪。
**Dwarkesh Patel**
或者至少,即使它不能真的做到白领人类能做的每一件事,它也会产生变革性的影响,就像在 IMO 获得金牌对世界没有产生变革性影响一样。
首先,我想指出我完全是在移动球门柱。当我两三年前采访 Dario 时(https://www.dwarkesh.com/p/dario-amodei),我问过这个问题:为什么他们没能利用其广博的知识来连接想法并以此做出新发现。这似乎是一件即使中等智力的人,如果知道这么多信息,也能从“这种药会引起偏头痛,另一种药有那种效果,也许同一种药可以同时治疗两种病”的事实中得出医学诊断的事情。
从局外人的角度看,数学显然是一个领域,其中找到单位距离问题猜想的反例(https://www.wsj.com/tech/ai/ai-math-solves-erdos-problem-openai-c4029e84)就是这类事情的例子。所以这完全是移动球门柱。但我们可以问,下一个基准是什么?既然 AI 能完成这件我们本应认为它们能做到的事情,那么下一个令人印象深刻的事情是什么?
这里有几种候选想法。一是首先提出有趣的问题,二是提出新的对象或概念化,从而创建或统一领域。关于第一点,我们现在有这些千禧年大奖问题,因为数学家注意到了它们。黎曼(https://en.wikipedia.org/wiki/Bernhard_Riemann)提出黎曼ζ函数这个想法,是因为他认为该函数的零点与素数(https://en.wikipedia.org/wiki/Prime_number)密度有某种联系。
弄清楚为什么我们首先认为这是一个值得研究的有趣问题,为什么我们构建这个对象并试图回答关于它的问题——特别是回答关于它的这个特定问题——这似乎是下一个基准之类的东西。
**Grant Sanderson**
你举了两个很好的例子。对于任何对单位距离猜想(https://openai.com/index/model-disproves-discrete-geometry-conjecture/)好奇的人,有一个名为 Polylog (https://www.youtube.com/@PolylogCS) 的数学频道的精彩视频(https://youtu.be/8rRM-xQTUTk) 讨论了它。
所有这些讨论都促使人们反思做数学的过程。他们会说,“哦,这东西能做这么厉害的事。这对我们意味着什么?”视频中有一个人引用了这样一句话:“好的数学家证明定理,伟大的数学家提出猜想,最伟大的数学家提出定义。”这基本上就是你的表述。我们需要猜想生成器,然后是定义生成器。那是顶级数学家。
我不明白如何确切地将其设为基准。通常,当我想到基准这个词时,我想到的是门柱。球要么进门,要么没进。你可以明确地说,“是的,这完成了。”部分原因是为了做像 RLVR (https://arxiv.org/abs/2506.14245) 这样的事情,但部分原因也是要知道你在回答时没有移动球门柱。OpenAI 可以有一个关于否定单位距离猜想的标题(https://openai.com/index/model-disproves-discrete-geometry-conjecture/),因为这是一个清晰、明确的事情。它做到了。而想象一下试图就 G...
相似文章
@rohanpaul_ai: 陶哲轩总结了AI如何大幅加速数学职业和数学研究。"在数学领域,以前你必须……
陶哲轩讨论了AI如何大幅加速数学研究,减少了为进入研究前沿所需的教育年限。
AI超越数学家
AI已经进步到能够为原创数学研究做出贡献的程度,超越了人类数学家,并可能减少对该职业的需求,尽管人类与AI的团队合作可能最终表现出色。
当AI做数学时,成为数学家意味着什么?
本文探讨了人工智能如何改变数学,引发了关于人类数学家角色的思考。文中引用了陶哲轩等专家的观点,并讨论了人工智能自动完成部分数学发现的潜力。
Terence Tao on How AI Is Changing Mathematics
数学家陶哲轩认为AI正在降低数学研究中的认知摩擦,使实验和大胆想法成为可能,并有望成为主流工具;他还预测未来数学发表将分享探索路径而非仅最终结果。
数学家发出警告:人工智能迅速崛起
随着人工智能持续快速发展,数学家们发出警告,引发了对潜在风险和伦理影响的担忧。