StatefulDiscovery: 开放端科学发现中基于证据校准的主张形成

arXiv cs.AI 论文

摘要

介绍StatefulDiscovery,一个用于开放端科学发现的框架,它利用外部化的调查状态来校准证据和主张,在生成得到充分支持的高价值主张方面优于基线方法。

arXiv:2606.11851v1 公告类型:新 摘要:开放端科学发现要求智能体超越为预定义问题执行分析。在多轮探索中,发现智能体必须决定哪些现象值得调查,同时避免过度解读——即新出现的主张超出支撑其分析证据的范围。这引出了一个证据校准问题:探索轨迹必须与主张状态耦合,使证据既能指导下一步调查内容,也能指导可以提出的主张。我们提出StatefulDiscovery,一种将调查状态外部化并用其协调前沿选择、证据获取和主张裁决的发现框架。我们在40个真实数据发现任务上评估了StatefulDiscovery。与多个基线相比,StatefulDiscovery生成的总体主张中被认为既得到充分支持又具有高价值的数量更多。消融实验表明,结构化假设、局部裁决和前沿控制对性能有贡献。综合来看,这些结果表明显式的发现状态能够将探索与基于证据校准的主张形成耦合起来。
查看原文
查看缓存全文

缓存时间: 2026/06/11 13:49

# StatefulDiscovery:开放式科学发现中证据校准的声明形成
来源:https://arxiv.org/abs/2606.11851
查看PDF (https://arxiv.org/pdf/2606.11851)

> 摘要:开放式科学发现要求智能体超越执行预定义问题的分析。在多轮探索中,发现智能体必须决定哪些现象值得调查,同时避免过度解读——即新形成的声明超出支撑其分析的证据范围。这产生了证据校准问题:探索轨迹必须与声明状态耦合,使证据既能指导下一步调查什么,又能指导可以声明什么。我们引入StatefulDiscovery,一种将调查状态外部化并利用它来协调前沿选择、证据获取和声明裁决的发现框架。我们在40个真实数据发现任务上评估了StatefulDiscovery。与多个基线相比,StatefulDiscovery生成了更多被判定为既有充分支持又有高价值的声明。消融实验表明,结构化假设、局部裁决和前沿控制对性能有贡献。这些结果共同表明,显式的发现状态能够将探索与证据校准的声明形成耦合起来。

## 提交历史

来自:Jiayao Chen [查看邮件 (https://arxiv.org/show-email/b7af9ecb/2606.11851)] **\[v1\]** 2026年6月10日星期三 09:28:28 UTC (2,709 KB)

相似文章

形式化猜想:数学中可验证发现的开放且持续演进的基准

arXiv cs.AI

本文介绍了形式化猜想(Formal Conjectures),这是一个持续演进的基准,包含2615个在 Lean 4 中形式化的数学陈述,其中包括用于证明发现的开放研究猜想和用于自动形式化的已解决问题,旨在零污染地评估自动推理系统。

LLM-AutoSciLab:通过主动实验实现闭环科学发现

arXiv cs.LG

LLM-AutoSciLab是一个闭环框架,利用LLM迭代生成假设、选择信息量大的实验并优化机制,在物理和生物学基准测试上相比之前的静态方法实现了更高的准确性和样本效率。

ScientistOne:通过 Chain-of-Evidence 实现人类级自主研究

arXiv cs.AI

ScientistOne 引入了 Chain-of-Evidence,这是一个面向自主研究代理的可验证性框架,确保每个声明都可追溯到证据来源。该框架实现了零幻觉引用、完美的分数验证,并在 75 篇论文中达到了最高的方法-代码对齐度,同时在五个前沿研究任务上达到或超过了人类专家水平。

声明式数据服务:用于组合数据系统的结构化智能体发现

arXiv cs.AI

本文提出了声明式数据服务(DDS),这是一种从声明式用户意图出发,对数据系统组合进行结构化智能体发现的架构。它将全局搜索分解为有界子搜索,并在一个交易后端工作负载上展示了收敛性,而在此负载上无界发现会失败。