@ProfBuehlerMIT:我们在自进化人工智能科学家方面取得了突破,从'搜索'转向'原则性发现':科学发现…

X AI KOLs Timeline 论文

摘要

MIT的研究人员发表了一篇关于自进化人工智能科学家的论文,这些科学家能够发现并调整自己的科学词汇,利用范畴论框架数学量化真正的创新,并将发现与单纯的搜索或检索区分开来。

我们在自进化人工智能科学家方面取得了突破,从'搜索'转向'原则性发现':科学发现要求搜索空间本身发生变化,而人工智能科学家必须在不加干预的情况下感知这种转变。我们首次构建了能够实现这一目标的人工智能,具备发现其推理所依赖的科学词汇的能力。证据、工具、产物、验证器、失败与主张都成为类型化的来源。我们展示了三种不同的模式:1) 检索,添加已知对象;2) 搜索,探索固定模式;以及关键性的 3) 发现,一种经验证的体系转换。 我们通过将主体工作流提升为类型化的共层,并利用Kan障碍证明真正的发现不是无界生成而是可验证的模式扩展,从而解决了开放性评估问题:旧证据通过左Kan扩展迁移,而真正的创新则通过迁移图像之外的逐点残差进行数学量化——从而将发现与单纯的搜索区分开来,使创新变得客观且可测量,而非主观判断或基准差异。 我们构建的AI科学家并非预先设想其选择的方法;相反,我们赋予系统形式化的能力,使其能够从基本原理出发进行适应、进化和推理。案例研究包括: 发现蛋白质中模式条件顺应性的Builder/Breaker模型; 发现各向异性纤维网络刚度规则的CategoryScienceClaw。 感谢与我的研究生@fwang108_ @MITdeptofBE的合作 F.Y. Wang 与 M.J. Buehler,《面向科学的自修正发现系统:主体人工智能的范畴论框架》,arXiv:2606.01444,2026年
查看原文
查看缓存全文

缓存时间: 2026/06/05 23:20

我们在自演化AI科学家领域取得了突破,从“搜索“迈向“有原则的发现“:科学发现要求搜索空间本身发生改变,而AI科学家必须无需干预就能感知这种转变。我们首次构建了具备这种能力的AI,它能够自主发现其在推理过程中使用的科学词汇。证据、工具、制品、验证器、失败与主张均成为带类型的溯源记录。我们展示了三种不同的模态:1)检索——加入已知对象;2)搜索——探索固定模式;以及关键的第3种:发现——一种经过验证的范式转变。

我们解决了开放性问题评估难题,方法是将智能体工作流提升为带类型的余层,并通过Kan阻碍证明:真正的发现并非无界生成,而是可验证的模式扩展:旧证据通过左Kan扩张迁移,真正的创新则由迁移图像之外的点态残差进行数学量化——从而将发现与单纯的搜索区分开来,使创新成为客观且可测量的标准,而非主观判断或基准差值。

我们的AI科学家在构建时并未预先设想其选择的方法;相反,我们赋予系统从基本原理出发进行适应、演化与推理的形式化能力。案例研究包括:

  • Builder/Breaker模型——发现蛋白质中的模式条件依从性;
  • CategoryScienceClaw——发现各向异性纤维网络刚度规律。

此项工作是与我的研究生 @fwang108_ @MITdeptofBE 合作完成的。

F.Y. Wang & M.J. Buehler,《自修正科学发现系统:智能体人工智能的范畴框架》,arXiv:2606.01444,2026

论文链接:

感谢 @somi_ai 提出的好问题。如果类型化是事后添加的,那么这种批评确实成立;但在我们的框架中,模式本身是审计状态的一部分:类型化操作、不可变血缘、门控、被拒绝的备选方案以及明确的范式转变。创新仅仅是迁移图像之外的残差(即旧证据通过左Kan扩张无法生成的部分),且仅在新状态通过自身门控后才成立。在Builder/Breaker模型中,模式条件依从性在扩大的证据集上通过了MDL检验,而任意精化都被拒绝/撤销。换句话说,主观性并非隐藏在本体选择中——它被暴露、约束并审计。

感谢 @AlphaWireHQ!

感谢!

你说得对,L是次可加的,我们并未假设可加性。发现成本定义为条件编码长度 L(I′ | im ρ̄);减法 L(I′) − L(im ρ̄) 只是其可加的极端情况(否则是次可加的上界)。图中的数字并非该成本,而是在固定证据下配对的MDL接受增益,我们已明确标注其“并非直接的数字发现成本“。因此,条件形式是跨范式的基本量;图中的前后差值则是单独的固定证据量。我们从未将两者等同。

感谢!

感谢!

相似文章

Rich Sutton on AI creativity and discovery

Hacker News Top

Rich Sutton argues that generative AI trained by supervised learning cannot achieve genuine novelty and quality simultaneously, and that true discovery requires a 'vary, evaluate, select' mechanism found in reinforcement learning rather than pure imitation.