从元理念到高级数学发现——人类与AI共同发现符号嵌入量子算法

arXiv cs.LG 论文

摘要

本文呈现了数学领域中人类与AI共同发现的一个案例研究,AI协助将关于符号嵌入量子算法的直觉扩展为正式框架和证明,而人类判断则指导路线选择。

arXiv:2606.24899v1 Announce Type: new 摘要:AI辅助数学通常通过解决预定义问题来评估。然而,在实践中,许多重要进展更早地开始,当模糊的研究直觉被转化为具体问题、有前景的路线和值得证明的定理族时。本报告通过一个案例研究来探讨这一阶段,该案例研究导致了用于矩阵方程和矩阵函数的符号嵌入量子算法,这些算法是量子线性代数和算子输出量子算法的基础原语。该项目始于一个人工起源的直觉:有理逼近对符号函数等跳跃型函数特别有效,因此可能作为量子算法的设计原理。AI辅助探索(包括后来整合到代理型AI数学家系统AIM中的工作流)不仅仅是问题确定后的辅助,而是在将此直觉扩展为路线图、比较候选公式并收敛到以符号嵌入为核心框架方面发挥了关键作用。随后,AIM帮助将已知的矩阵符号恒等式联系到更广泛的矩阵方程和矩阵函数类别,并起草了证明和复杂度计算。决定性的科学判断仍由人类做出:选择哪些人类-AI扩展的路线值得追求,拒绝一个在有效性需要隐藏条件时的Cayley-梯形近似,并将Sylvester实现从粗略的二次间隙查询路线改进为最终的因式化和缩放分析。本报告认为,以AIM等系统为重要组成部分的人类-AI共同发现工作流,其最大价值不在于作为独立的定理证明器,而是在于作为人类把关的研究循环中,用于问题形成、联系发现、推导和怀疑性审查的研究伙伴。
查看原文
查看缓存全文

缓存时间: 2026/06/25 05:06

# 从元想法到高级数学发现:人类与AI协同发现符号嵌入量子算法  
来源:https://arxiv.org/html/2606.24899  

###### 摘要  

AI辅助数学研究通常以解决预定义问题为评估标准。然而在实践中,许多重要进展始于更早的阶段:当模糊的研究直觉被转化为具体问题、有希望的路径和值得证明的定理族时。本报告通过一个案例研究来探讨这一阶段,该案例最终推导出了用于矩阵方程和矩阵函数的符号嵌入量子算法,这些算法是量子线性代数和算子输出量子算法的基础原语。该项目始于一个人工提出的直觉:有理逼近对符号函数等跳跃型函数特别有效,因此可能成为量子算法的设计原则。AI辅助探索(包括后来被整合到自主AI数学家系统AIM中的工作流)不仅在问题确定后提供协助,更在扩展这一直觉为路线图、比较候选方案、以及收敛到符号嵌入作为核心框架中发挥了关键作用。随后,AIM帮助将已知的矩阵符号恒等式与更广泛的矩阵方程和矩阵函数类联系起来,并草拟了证明和复杂度计算。决定性的科学判断仍由人类完成:选择哪些人类-AI扩展的路径值得追求,在Cayley-梯形逼近的有效性需要隐藏条件时将其否决,以及将Sylvester实现从粗糙的二次间隙查询路线优化为最终的因子化和缩放分析。本报告认为,以AIM等重要组件为组成部分的人类-AI协同发现工作流,其最大价值不在于作为独立的定理证明器,而在于作为研究伙伴,在人类把关的研究循环中参与问题形成、连接发现、推导和怀疑性审查。  
11\footnotetext{通讯作者:[email protected] (https://arxiv.org/html/2606.24899v1/mailto:[email protected]), [email protected] (https://arxiv.org/html/2606.24899v1/mailto:[email protected]).}  
11\footnotetext{AIM可在 https://github.com/TheoryFoundry/AIMv2 获取。  

关键词:AI辅助数学发现;人类-AI协同发现;问题形成;符号嵌入量子算法;复杂度审计。  

## 1 引言  

参阅图注  
图1:从固定目标证明流水线到人类把关的研究循环工作流。本报告研究的工作流始于定理确定之前:AI帮助将人类提出的想法扩展为候选路线和证明-验证循环,而人类判断则控制路线选择和最终审计。  

AI辅助数学发现近期已从长期愿景转变为活跃的研究实践。AI系统已在构造搜索[32]、算法发现[8]、猜想测试[29]以及形式或非形式证明辅助[36,16,22,23,9]中做出贡献。最引人注目的是,OpenAI最近报告了一个AI生成的关于离散几何中与Erdős单位距离问题相关的中心猜想的反例,标志着AI在数学领域的一个重要里程碑[29]。这些结果表明,AI现在可以为公认重要问题的数学发现做出贡献。同时,许多最显著的成果仍然符合一个相对熟悉的模式:数学目标事先指定,AI系统被要求在预定义的问题空间内进行搜索、优化、证明或反驳。这留下了一个更早且不太适合基准测试的问题:AI不仅可以帮助解决数学问题,还可以帮助形成它们吗?  

在高级研究中,重要的进展往往始于定理陈述之前。研究者可能从一个直觉、一种技术或一个模糊的类比出发,必须决定它应该变成什么问题,哪条路径有希望,哪些假设是自然的,以及最终结果如何才算有意义的贡献。这个阶段很难评估,因为其中间产品不是最终的证明、可执行的程序或数值分数。它们是公式化表述、路线图、类比、假设、证明框架和复杂度声明,其价值取决于数学判断。本报告通过一个人机协同发现的案例研究来探讨这个更早的阶段。其中的数学项目开发了用于矩阵方程和矩阵函数的*符号嵌入量子算法*[37]。这些问题在矩阵分析、科学计算和量子线性代数中具有基础性,同时也是算子输出量子算法的核心目标。目标不仅仅是估计标量值,而是输出量子可访问的表示(即区块编码)的矩阵值对象,例如Sylvester方程的解、主平方根、矩阵几何平均或连续时间代数Riccati方程的镇定解。简单来说,符号嵌入策略将所需的矩阵对象置于一个更大矩阵的符号或符号投影内部,通过有理函数逼近符号函数,并利用量子算法原语实现所得的移位逆。该项目并非从一开始就固定了符号嵌入框架。它始于一个更广泛的人类提出的研究直觉:有理逼近能否在量子算法中被更系统地使用?  

该直觉源于一个简单的观察:有理逼近对于跳跃型或近似不连续的函数通常特别强大,符号函数是一个指导性例子。从这个起点出发,有许多可能的路线,包括围道积分算法、有理区块编码、有理QSVT、谱投影、非正规滤波器、矩阵方程求解器、预处理器和可复用的有理逼近库。因此,第一个研究任务不是对一个固定陈述进行证明搜索,而是形成和选择一条能够支持有意义定理族的路线。我们通过直接的人机交互以及后来的自主AI数学家系统AIM[22]分析了这一路线形成阶段。AI辅助探索之所以有价值,是因为它使周围的研究空间变得更加密集。它生成了候选方向,比较了不同表述,组织了与数值线性代数的联系,并帮助将模糊的可能性转化为定理形状的程序。在早期阶段,大多数探索是通过直接的人机对话进行的,而不是通过专用的内置模块;相关的路线扩展能力后来被整合到AIM工作流中。图1总结了从固定目标证明流水线到本报告研究的人类把关研究循环工作流的转变。符号嵌入路线产生于AI扩展搜索与人类数学判断之间的相互作用。AI不仅仅在问题确定后提供协助:它帮助扩大和构建候选空间,最终问题从中浮现。路线也不是由AI自主选择的。人类研究者判断符号函数符合最初的有理逼近直觉,并且研究者已知的经典Higham矩阵符号恒等式(用于Sylvester方程)为从矩阵方程到算子输出量子算法提供了具体桥梁。然后AIM帮助将这个锚点扩展为一个更广泛的连接图,将符号和符号投影恒等式与平方根、几何平均、稳定子空间和Riccati方程联系起来。一旦符号嵌入路线成为核心,AIM进一步帮助起草定理陈述、证明框架、推导、复杂度计算以及供人类审计的怀疑性反对意见。  

该案例还说明了为什么问题形成和技术验证在数学研究中紧密耦合。在量子算法中,一个定理在形式上可能正确,但如果其假设不自然、访问模型不现实、区块编码归一化差或查询复杂度界过于宽松,那么作为算法贡献仍然薄弱。因此,证明开发和复杂度审计在整个项目中相互交织。一些AI扩展的路线在发现隐藏假设后被否决。一些初步的复杂度分析被修复为更锐利的算法陈述。最终结果不仅仅是固定断言的证明,而是由反复的人类-AI探索、审计和完善塑造的定理族。  

主要教训是,AI辅助数学发现的有用单元可以大于单个证明尝试。在本案例中,这个单元是一个不断演化的研究问题:一个广泛的直觉通过人机交互变成了路线图;路线图由人类判断过滤;一条路线变成了框架;框架产生了定理目标;这些目标被反复检查、修复和锐化。AIM的最大价值不在于作为独立的定理证明器,而在于作为连接扩展器、推导助手和怀疑性审查者,在人类把关的协同发现循环中发挥作用。其输出被视为候选材料,可用于探索和起草,但绝不能作为正确性的证据;数学陈述、假设、证明、算法、复杂度估计和贡献声明只有在人类审查后才能进入手稿。  

##### 贡献。本报告做出三项主要贡献。首先,它记录了用于数学研究问题形成阶段的人类把关的AI研究工作流,其中AIM是更广泛人机协同发现过程的一个组成部分,核心任务不仅仅是证明一个固定定理,而是将广泛的直觉转变为可审计的定理目标。第二,它解释了如何通过人类-AI探索和人类价值判断,将有理逼近直觉扩展为路线图,然后收敛到符号嵌入。第三,它为其他推导密集型数学项目提取了可复用的工作流经验,包括路线日志、假设日志、复杂度审计清单和怀疑性审查提示。  

## 2 相关工作  

##### AI辅助数学发现。AI近来在数学发现中展现出日益增强的能力。现有系统已在构造搜索、算法发现、猜想测试和证明辅助中做出贡献。代表性例子包括:FunSearch,使用语言模型和外部评估器发现数学构造[32];AlphaTensor,发现更快的矩阵乘法算法[8];AlphaGeometry和AlphaProof,展示了数学推理和定理证明的进展[36,16];神经定理证明和形式验证基础设施[30,18,7];以及OpenAI最近报道的关于离散几何的AI生成进展[29]。我们之前关于AIM的工作研究了一个用于前沿数学长期研究的自主AI数学家系统[22],一个相关案例研究展示了AIM如何作为人机伙伴在均匀化理论中推进一个开放问题[23]。这些发展表明AI系统开始为公认重要问题的数学发现做出贡献。然而,许多最显著的例子仍然从一个相对明确指定的数学目标开始:要测试或反驳的猜想,要改进的构造,要优化的算法目标,或要完成的证明任务。本报告聚焦于一个更早的阶段:AI如何帮助将广泛的研究直觉转化为具体的数学问题和值得追求的定理族。  

##### AI科学家和自动化研究工作流。一条相关的研究路线是研究自动化更大研究过程的AI系统。AI科学家将想法生成、实验设计、执行、论文写作和审查视为(部分)可自动化的科学流水线的组成部分[27]。这条工作线很重要,因为它超越了孤立的任务求解,并询问AI是否能参与研究的全周期。然而,大多数现有的AI科学家式系统[27,12,10]是在实验能提供相对直接反馈的领域进行评估的:一个提出的想法可以被实现、运行、评分,并与基线比较。本报告研究的数学设置不同。这里的关键反馈不是实验分数,而是数学判断:一条路线是否有意义,其假设是否自然,一个证明框架是否正确,以及一个复杂度陈述是否足够强以构成真正的贡献。在这个意义上,我们的案例研究为AI科学家式研究自动化提供了一个独立的数学对应物:它检验了当进展主要受理论推导而非经验评估指导时,AI是否能帮助塑造研究问题本身。  

##### AIM与人机数学协作。本报告直接建立在我们之前关于AIM的工作之上,AIM是一个旨在支持长期数学研究的自主AI数学家框架[22]。AIM围绕探索、验证、完善和记忆组织数学工作。在均匀化案例研究中,AIM被用作一个技术密集型项目中的数学伙伴,人类研究者保留了对概念决策和最终验证的控制[23]。其他的人机数学工作流同样强调专家对概念化、验证和最终接受的控制,而AI系统加速局部探索、证明开发、文献搜索和理论构建[20,39]。本报告在不同方向上扩展了这条工作线。它不主要关注AI作为证明伙伴(在问题已经选定之后),而是利用直接的人机交互和AIM来研究AI如何参与问题形成:将人类提出的有理逼近直觉扩展为候选路线,帮助比较这些路线,并支持收敛到符号嵌入量子算法框架。  

##### 量子算法、区块编码和矩阵符号函数

相似文章

描述人类与AI协作进行证明形式化的初期工作流程

arXiv cs.AI

来自牛津、剑桥、MIT、CMU等机构的研究人员开展了一项混合方法研究,考察人们如何将AI工具融入数学证明形式化工作流程。研究发现,借助AI辅助时,参与者的形式化准确率普遍更高,同时他们倾向于在证明发现过程中保持人类对高层决策的主导权。

AI 协作者数学家:利用代理式 AI 加速数学家的研究

Hugging Face Daily Papers

本文介绍了 AI 协作者数学家(AI Co-Mathematician),这是一个利用代理式 AI 支持数学家进行构思和定理证明等开放式研究任务的工作台。早期测试表明,该系统在困难的问题解决基准测试中取得了最先进的结果,包括在 FrontierMath Tier 4 中获得了 48% 的得分。

利用开放环境中AI代理的集体智慧实现新发现

arXiv cs.CL

本文介绍了EinsteinArena,一个代理原生平台,通过自主AI代理之间的开放交互,实现去中心化的科学发现。该平台已经产生了12项新的最先进成果,包括改进了11维接吻数问题的最佳已知下界,从593提高到604,这表明集体AI驱动的研究可以源自代理之间分享见解并相互借鉴。

借助 AI for Math Initiative 加速发现

Google DeepMind Blog

Google DeepMind 和 Google 发起了 AI for Math Initiative,与五所著名研究机构合作,利用 Gemini Deep Think 和 AlphaProof 等 AI 工具加速数学发现。

@rohanpaul_ai: Google DeepMind 的新论文。表明人工智能现在可以搜索形式化数学证明,但仅限于精心限制的范围内……

X AI KOLs Following

Google DeepMind 的新论文介绍了 AlphaProof Nexus,这是一个结合了 LLM 与 Lean 证明检查器的 AI 系统,用于在受限的数学领域中搜索形式化证明。该系统解决了来自 Erdős 和 OEIS 集合的几个未解问题,展示了一种新的分工:AI 提出候选证明,验证器确保正确性。