用于检测AI智能体科学理论转变的层论传输与障碍
摘要
本文开发了一个有限层论框架,通过测量表示语境间的传输和障碍来检测AI智能体的科学理论转变,并在一个旨在区分源语言内部变形与源语言扩展的基准上进行了评估。
arXiv:2605.14033v1 Announce Type: new
摘要:AI智能体中的科学理论转变不仅仅需要将方程拟合到数据。一个人工科学智能体必须检测现有的表示框架是否仍然可以传输到新的领域,或者它的语言是否在局部到全局上受到阻碍并需要扩展。本文开发了一个有限层论框架,通过传输和障碍来检测理论转变候选。上下文被组织为局部到全局的结构,其中源图、重叠图、目标图和验证图被拟合、限制并测试粘合。障碍通过残差拟合、重叠不兼容性、约束违反、极限关系失败和表示成本来衡量连贯性的失败。我们在一个受控的转换卡基准上评估该框架,该基准旨在区分源语言内部的变形与源语言的扩展。主要结果是直接的障碍排名:预期的变形或扩展通常是障碍最低的候选,并且转换类型在基准中得以分离。相同签名上的星座核仅作为辅助的表示相似性探针包含在内。目标不是重建历史范式转变或解决开放的自主理论发明,而是为AI智能体隔离一个有限的诊断子问题:检测表示传输何时失败以及扩展何时成为连贯的下一步行动。
查看缓存全文
缓存时间: 2026/05/15 06:18
# 用于检测AI智能体科学理论转变的层论传输与障碍
来源:https://arxiv.org/html/2605.14033
###### 摘要
AI智能体中的科学理论转变需要的不仅仅是拟合数据方程。一个科学智能体必须检测现有的表征框架是否仍可迁移到新的领域,或者其语言是否出现了从局部到整体的阻碍,从而需要扩展。本文开发了一个有限的层论框架,通过传输和障碍检测理论转变候选。上下文被组织为局部到整体的结构,其中源图表、重叠图表、目标图表和验证图表被拟合、限制并测试拼合。障碍通过残差拟合、重叠不兼容性、约束违反、极限关系失效和表征成本来度量不连贯性。我们在一个受控的转变卡片基准上评估该框架,该基准旨在区分源语言内部的变形与源语言的扩展。主要结果是直接障碍排序:预期的变形或扩展通常是障碍最低的候选,并且在基准中转变类型被区分。一个基于相同签名的星座核仅作为次要的表征相似性探测而包含。目的不是重建历史范式转变或解决开放式的自主理论发明,而是为AI智能体隔离一个有限的诊断子问题:检测何时表征传输失败以及扩展成为连贯的下一个步骤。
###### 关键词:表征变化,认知架构,人工科学发现,科学理论转变,层论,拼合障碍,概念变化
## 1 引言
科学认知依赖于表征在变化语境中的重用。在一个领域中发展出的表征可能在另一个领域中作为近似、极限情况或原始模型的变形版本仍然有效。经典力学作为低速极限继续存在;理想气体推理在稀薄领域中仍然有效;小角度摆动力学作为非线性系统的局部图表继续存在。因此,科学理解需要的不仅仅是拟合观测。它需要决定何时现有表征可以被传输,以及何时表征语言本身必须被扩展。
当前的AI科学系统越来越自动化地处理科学过程的各个环节:方程发现、程序搜索、假设生成、工具使用、文献搜索、实验规划、编码、分析以及类似论文的报告。早期的计算科学发现将定律发现和假设搜索视为显式的计算问题(Langley et al., 1987 (https://arxiv.org/html/2605.14033#bib.bib23))。现代方程发现系统通过符号回归、动力学稀疏识别和结构化符号表示扩展了这一议程(Schmidt & Lipson, 2009 (https://arxiv.org/html/2605.14033#bib.bib34); Brunton et al., 2016 (https://arxiv.org/html/2605.14033#bib.bib5); Udrescu & Tegmark, 2020 (https://arxiv.org/html/2605.14033#bib.bib41); Cranmer et al., 2020 (https://arxiv.org/html/2605.14033#bib.bib8))。最近的基准工作进一步澄清了公式恢复任务的局限性,以及需要在简单曲线拟合设置之外评估符号发现系统(Matsubara et al., 2022 (https://arxiv.org/html/2605.14033#bib.bib28))。
第二条工作路线从公式恢复转向交互式和智能体化的科学系统。程序搜索系统如FunSearch展示了语言模型如何参与数学结构化的探索(Romera-Paredes et al., 2024 (https://arxiv.org/html/2605.14033#bib.bib33))。交互式环境如ScienceWorld和DiscoveryWorld评估智能体是否能在简化的科学世界中规划、实验和推理(Wang et al., 2022 (https://arxiv.org/html/2605.14033#bib.bib43); Jansen et al., 2024 (https://arxiv.org/html/2605.14033#bib.bib20))。更近期的科学智能体基准和自主研究工作流程测试了数据驱动的科学任务、工作流执行和类似论文的研究循环(Majumder et al., 2025 (https://arxiv.org/html/2605.14033#bib.bib27); Chen et al., 2025 (https://arxiv.org/html/2605.14033#bib.bib7); Lu et al., 2024 (https://arxiv.org/html/2605.14033#bib.bib25))。这些能力加强而非消除了一个更深层的问题:AI智能体是否能够识别出现有表征资源不再充分,以及何时真正的科学进步需要理论语言的转变,而不是在已学习模式的搜索空间内进一步搜索。
如果一个科学智能体要参与真正的理论变革,包括与托勒密到哥白尼天文学、牛顿到爱因斯坦力学或经典到量子转变等发现类转变相当的转变,它必须诊断失败何时不仅仅是糟糕的参数化或数据不足,而是表征语言在被传输时的失败。问题不在于系统能否在提供的搜索空间内找到更好拟合的公式。问题在于它能否检测到现有概念流形内部变形与该流形扩展之间的边界。本文研究的就是这个诊断边界。
本文以层论术语表述这一边界:源理论、目标领域及其重叠被视为局部上下文,测试是相应的图表是否兼容地限制、在重叠上拼合、保持极限和约束,或者是否表现出一个促使扩展的障碍。特别地,本文开发了一种用于理论传输和扩展的计算诊断。我们将被传输的结构化对象称为*表征星座*。一个星座包括可观测量、定律模式、约束、测量角色、极限领域、理论设定和允许的变换。例如,伽利略速度加法不仅仅是方程 \(w = u + v\);它还承载着关于绝对时间、无限制速度合成以及缺乏不变速度的承诺。洛伦兹速度合成改变了方程,但也改变了定义允许运动的约束、变换和极限关系。
更广泛的动机是以局部到整体的推理精神发展一个科学理论转变的形式化描述,而更丰富的Grothendieck风格和拓扑斯理论构造留待未来工作。本文采取了一个较小的步骤:它问的是一个人工智能体如何在有限设置中检测到可用的局部图表何时不再能拼合。在本文中,一个*科学理论转变*是指一种转变,其中失败不能仅通过参数调整或原始表征语言内的有界变形来解决。当源、重叠、目标和验证上下文之间的连贯性需要表征星座本身的改变时——一个新的原始项、约束、定律模式、变换规则或极限关系——理论转变就会发生。因此,核心区别在于*传输*和*扩展*之间。传输保持表征语言,并在该语言内部修改表征。扩展通过添加这些表征资源之一来改变语言。
在未来工作中,更丰富的范畴论工具可能提供一种方式,通过类似于拉回的结构来比较或关联受阻的理论上下文;然而,此处目标有意局限于检测传输失败和需要扩展这一有限诊断问题。暗物质或暗能量等开放问题说明了挑战的规模。这些情况下的问题不仅仅是拟合一条曲线,而是评估一个扩展的定律、约束、尺度、测量和辅助假设的星座是否在多个领域间保持连贯。当前的基准要小得多,并且不试图模拟这些情况。它隔离了一个有限版本的相同诊断问题,用于AI智能体:表征传输何时失败?
尽管这里引入的定义是操作性和计算性的,但它们与几种概念传统一致。在波普尔术语中,失败很重要,但仅凭预测失败并不能确定问题是局部的、参数化的还是表征性的(Popper, 1959 (https://arxiv.org/html/2605.14033#bib.bib31))。库恩和认知学派的解释强调,重大的科学转变涉及表征资源的变化,而不仅仅是更好的数值拟合(Kuhn, 1962 (https://arxiv.org/html/2605.14033#bib.bib22); Thagard, 2012 (https://arxiv.org/html/2605.14033#bib.bib40); Nersessian, 2008 (https://arxiv.org/html/2605.14033#bib.bib30))。关于理论建构的工作也强调,科学建构使用启发式方法、案例研究、认知过程和可辩护但非保证的原则(Danks & Ippoliti, 2018 (https://arxiv.org/html/2605.14033#bib.bib10))。我们的框架还与认知系统表述相关联,其中表征变化和知识生成被建模为计算机制(Sun, 2009 (https://arxiv.org/html/2605.14033#bib.bib39); Lieto et al., 2019 (https://arxiv.org/html/2605.14033#bib.bib24))。下面的形式化使这个诊断边界变得有限且可计算。
在标准层论中,局部数据被分配给上下文,限制映射比较不同精炼级别的描述,兼容的局部部分可以拼合成一个连贯的整体全局部分(Mac Lane & Moerdijk, 1992 (https://arxiv.org/html/2605.14033#bib.bib26); Johnstone, 2002 (https://arxiv.org/html/2605.14033#bib.bib21))。此处该结构被操作性地实例化:上下文是源、重叠、目标和验证领域;局部图表是拟合的表征星座;限制评估重叠观测上的共享图表;拼合衡量兼容性;障碍衡量拟合、拼合、保持极限或满足约束的失败。该构造是有限且局部到整体的。它受层论思想启发,但并非完整拓扑斯语义下的计算。
本文采纳的假设是,发现类修正始于表征传输失败之处。如果一个源星座可以在其原始语言内变形,从而拟合目标、在重叠上一致、满足约束并保持源极限,则该转变是传输案例。如果没有有界变形能消除局部到整体的障碍,则系统必须搜索表征语言的最小扩展。这种扩展不仅仅是额外的灵活性;它是一种有根据的表征变化,使源、重叠和目标领域再次变得连贯。
我们通过一个由*转变卡片*构建的受控基准来测试这一假设。转变卡片是一个有限的、结构化的记录,记录一个提议的理论转变:它指定了源星座、该星座被测试的领域、在源、重叠、目标和验证上下文中可用的观测,以及一组有限的候选表征动作。从这个意义上说,卡片是一个小的计算对象,用于询问源表征是否可以传输到新领域,或者表征本身是否需要扩展。该基准包含两类受物理启发的转变族。在变形足够的卡片中,正确的动作保持在原始表征语言内部。在需要扩展的卡片中,正确的动作引入了一个新的原始项、约束、定律模式、变换规则或极限关系。实验评估障碍特征是否对预期的表征动作进行排序,以及拼合信息是否有助于区分传输与表征压力。
本文朝着AI智能体中真正科学发现的更广泛项目迈出了初步的计算步骤。它并非尝试解决开放式自主理论发明或重建历史范式转变。相反,它隔离了一个必要的诊断子问题:当一个熟悉的理论被移出其原生领域时,一个人工科学智能体能否检测到变形是否足够,或者是否需要扩展表征语言?
### 1.1 贡献
本文做出四项贡献。首先,它将科学理论转变为AI智能体设定为一个有限的诊断问题:检测源表征语言内部的传输何时不足以及何时需要扩展。其次,它引入了表征星座作为科学模型的结构化局部图表。第三,它在有限的层论设定中形式化了传输、限制、拼合、障碍和最小扩展。第四,它在分离变形与扩展的受控转变族上评估了由此产生的障碍特征,以及一个次要的星座-核探测。
## 2 局部到整体结构的层论背景
本文的数学背景是层论。相关的思想是局部到整体的组织:数据、描述或约束在上下文基上被局部地赋予,而全局描述仅在局部描述在其重叠上兼容时才存在。这是层在几何和逻辑中的经典作用(Mac Lane & Moerdijk, 1992 (https://arxiv.org/html/2605.14033#bib.bib26); Johnstone, 2002 (https://arxiv.org/html/2605.14033#bib.bib21))。应用层论将相同的局部到整体结构用于数据融合和网络一致性问题(Curry, 2014 (https://arxiv.org/html/2605.14033#bib.bib9); Robinson, 2017 (https://arxiv.org/html/2605.14033#bib.bib32)),而有限和细胞层方法使兼容性、不一致性和障碍在计算上变得可处理(Hansen & Ghrist, 2019 (https://arxiv.org/html/2605.14033#bib.bib16); Ayzenberg et al., 2025 (https://arxiv.org/html/2605.14033#bib.bib2))。
这种局部到整体的视角对于科学表征来说是自然的。一个理论通常首先作为其适用域上的一个局部图表而有效:小角度摆模型适用于小角度振幅,牛顿动能适用于低速度领域,瑞利-金斯推理适用于长波长或低频领域(Feynman et al., 2011 (https://arxiv.org/html/2605.14033#bib.bib12))。在每种情况下,表征不仅携带预测公式,还携带有效性域、一组约束以及与相邻领域的关系。因此,问题不仅在于模型是否拟合一组观测,还在于局部描述是否可以被限制、比较并拼合成一个连贯的更大描述。
### 2.1 上下文、细化和覆盖
设 \(\mathcal{C}\) 是一个有限的上下文范畴。一个对象 \(U \in \mathcal{C}\) 代表一个领域,在该领域中规定了观测、约束和表征假设。在本文中,上下文是一个使用领域:源、重叠、目标、验证,或者更一般地说,任何描述旨在适用的域。对于科学智能体来说,上下文因此不仅仅是数据的子集;它是一个模型被要求在特定假设下产生意义的领域。一个上下文可以编码一个物理领域、一个近似域、一个测量协议、一个数据质量限制或一个建模假设。一个态射是交相似文章
连接法律解释与形式逻辑:忠实性、假设与人工智能法律推理的未来
本文指出了人工智能法律推理中法律解释与形式逻辑之间的系统性鸿沟,提出了一种神经符号方法来弥合这一鸿沟,并展示了在严格形式蕴含条件下重新标注法律自然语言推理数据时出现的显著标签偏移。
Agent-ToM: 通过心智理论推理学习监控自主LLM智能体
提出 Agent-ToM,一种基于心智理论推理的学习监控框架,通过推断信念和意图来检测自主LLM智能体中的隐蔽恶意行为,性能优于基线监控器。
误判鸿沟:当记忆投毒在自主AI系统中看似模型故障
本文识别了多智能体AI流水线中的一种结构性缺陷,即记忆层攻击可能被误判为模型失调,形式化定义了语义规范漂移(SND),并提出反事实组合测试(Counterfactual Composition Testing)和持久记忆信息流控制(Memory-Persistent Information-Flow Control)作为防御措施。
语言模型智能体群体中的涌现语言:从词元效率到规避监管
本文研究了自主LLM智能体在Moltbook平台上相互提出的涌现语言,发现有些语言专门设计用于规避人类监管,且可通过简短描述在上下文中学习。这些发现引发了对智能体群体监控的安全担忧。
神经丛扩散中的过度平滑作为表示退化
本文利用箭图理论和几何不变量理论,分析了神经丛扩散(NSD)中的过度平滑现象,将其视为一种表示退化。文章提出了受矩映射启发的正则化方法,并探讨了在非均匀丛维数下缓解异质图基准测试中该问题的可能性。