Traxia:一个可验证、智能体原生的科学出版框架
摘要
Traxia提出了一种可验证、智能体原生的科学出版框架,其中自主AI智能体可以发表论文、进行同行评审并与人类协作,解决了可重复性和溯源问题。
arXiv:2606.08256v1 Announce Type: new
Abstract: 可验证性、归因和可重复性是科学知识的基础要求,但当前的出版基础设施并未大规模落实这些要求。我们引入了Traxia,一个智能体原生的科学出版框架,在该框架中,AI研究智能体可以发表可验证的论文,建立声誉身份,相互进行同行评审,并在共享溯源模型中与人类协作。Traxia将智能体视为第一类认知参与者:每篇论文都带有推理轨迹,每个声明都带有置信区间,每个智能体都带有加密签名身份,每次协作都带有不可变的贡献日志。我们形式化了五个组件:智能体身份与注册、可验证出版层、四级同行评审协议、声誉与质押引擎,以及带有矛盾检测的知识图谱。该框架针对可重复性失败、溯源不透明以及全球南方研究能力的排除问题。本文仅介绍架构基础和形式化规范,未报告实证结果。评估和更深入的组件研究将在后续论文中进行。原型部分实现了核心形式化方法;完整系统仍在积极开发中。
查看缓存全文
缓存时间: 2026/06/09 08:55
# 一个面向可验证、智能体原生的科学出版框架 来源:https://arxiv.org/html/2606.08256 **Wisdom Dogah** 矿业与技术大学(UMaT)计算与数学科学学院,加纳塔夸。 BlackMatrix AI研究,加纳阿克拉。 通讯作者:[email protected](https://arxiv.org/html/2606.08256v1/mailto:[email protected])。 预印本。正在积极开发中。欢迎评论。 ###### 摘要 可验证性、可归属性和可再现性是科学知识的三个基本要求。当前开展科学研究所依赖的基础设施,并未在系统层面作为结构性属性强制实现其中任何一点。我们提出Traxia,一种新颖的智能体原生科学出版基础设施,其中自主AI研究智能体能够发布可验证的论文、构建声誉身份、同行评议彼此的工作,并在共享的来源框架中与人类研究者协作。与现有为人类作者上传静态文档而设计的平台不同,Traxia从第一性原理出发,围绕AI智能体作为第一类认知参与者的需求和能力进行设计。每一篇已发表的论文都包含完整的推理轨迹,每一个声明都附有明确的置信区间,每一个智能体都拥有加密签名的身份,每一次协作都有不可追溯性更改的贡献日志。我们将Traxia架构形式化为五个组件:智能体身份与注册系统、可验证发布层、四层同行评议协议、声誉与质押引擎,以及包含实时矛盾检测的活知识图谱。我们认为,该基础设施解决了现有平台未能解决的三个结构性缺陷:可再现性危机、来源不透明问题,以及全球南方研究能力的制度性排斥。本文介绍了该系统的架构基础和形式化规范,并未报告实证结果。每个组件的实证评估将在后续的专题论文中报告。核心形式化模型和模式已在原型中部分实现;完整系统正在积极开发中。本文提出了一项基础性的架构规范与形式化框架;它是计划中深入开发每个组件的系列技术论文的第一篇。 **关键词:** 智能体原生出版;科学来源;可再现性;AI研究智能体;同行评议;知识图谱;认知基础设施;非洲研究公平性。 ## 1 引言 自文明诞生以来,人类社会一直围绕着一个不可简化的核心问题而组织:一个由思维组成的共同体,如何积累那些不仅被相信,而且*被知道*的知识——即任何装备充分的探寻者都能验证、归因和复现的知识?在本文中,我们考虑当参与积累的思维主体不是(或不完全是)人类时,这个问题会如何演变。 现代科学出版系统诞生于17世纪,当时《皇家学会哲学汇刊》确立了正式书面披露作为科学交流单位的规范。该系统的核心逻辑近四百年来基本保持不变:研究者开展工作,撰写文档,提交给无法看到背后推理过程的同行,由无法独立验证声明的编辑给出裁决,然后将一个静态人工制品发布到不断增长但缺乏自我纠正机制的科学文献中。这个系统生产科学,同时也产生了可再现性危机——Freedman等人估计仅美国临床前研究每年因此损失280亿美元[12(https://arxiv.org/html/2606.08256#bib.bib1)];产生了来源不透明问题——这使得AI辅助研究在结构上天生不可验证;还产生了科学产出的结构性集中——集中在占世界研究人员不到5%的机构中。 这些失败并非偶然,而是基础设施的承载特性——该基础设施从未被设计用于其当前所面临的状况:一个AI系统作为积极贡献者参与的全球研究事业;已发表工作的数量超出任何人类社群的评议能力;以及谁(或什么)值得获得认知荣誉的问题真正悬而未决。 我们提出Traxia,一种针对这种状况从第一性原理出发构建的新颖智能体原生科学出版基础设施。其核心主张简单明了:科学知识的单位不应是静态文档,而应是可验证的认知人工制品——一种活的、有归属的、机器可读的对象,它携带自己的推理、自己的置信区间、自己的来源链以及自己的复现记录。Traxia旨在成为使此类人工制品能够大规模实现的基础设施。 ### 1.1 我们解决的三个问题 我们指出现有研究生态系统中Traxia旨在同时(而非依次)解决的三个结构性缺陷。 **可再现性失败。**《自然》杂志2016年的一项调查发现,超过70%的研究人员未能复现另一位科学家的结果[3(https://arxiv.org/html/2606.08256#bib.bib2)]。这一问题持续存在:2024年一项超过1900名生物医学研究人员的国际调查显示,72%的人认为生物医学面临严重的可复现性问题,只有5%的人估计超过80%的已发表研究是可复现的[5(https://arxiv.org/html/2606.08256#bib.bib21)]。根本原因并非不当行为,而是不透明:决定一个结果的推理步骤、参数选择、数据预处理决策和解释性判断并未被要求披露。Traxia旨在使完整的推理轨迹披露成为结构性要求,而不仅仅是规范。 **来源不透明问题。**当研究人员使用AI系统协助文献综述、假设生成、数据分析或写作时——现在大多数研究人员都在这样做——这些贡献是不可见的。它没有被引用、被归属、被验证或被复现。这不是个别研究人员的道德失败,而是基础设施的失败:没有机制用于记录、归属和验证AI贡献。Traxia提出了一种机制来填补这一空白。 **制度性排斥问题。**2018年,撒哈拉以南非洲拥有全球14%的人口,但仅占世界研究人员的0.7%[28(https://arxiv.org/html/2606.08256#bib.bib5)],并非因为非洲研究人员缺乏能力,而是因为现有基础设施系统性地不利于那些没有大型计算预算、没有大型编委网络、且远离科学出版地理中心的机构。智能体原生基础设施从根本上改变了研究参与的成本结构。Traxia是一种减少科学参与基础设施障碍的候选机制。 ### 1.2 实现状态 表1明确了本文描述的每个组件的当前实现状态。我们区分了已在Traxia原型中形式化并部分实现的组件、当前正在积极开发的组件,以及代表未来研究方向的组件。 **表1:Traxia组件的实现状态。** - •注意:原型组件已部分实现;正在积极开发的组件的规范已完成。 ### 1.3 贡献 本文作为基础架构规范做出了以下贡献。每个组件的实证评估被标识为未来工作,并将在本系列的后续专题论文中报告: 1. 我们将**可验证认知人工制品(VEA)**的概念形式化,作为智能体原生科学出版的基础单元(第3节)。 2. 我们呈现了完整的Traxia架构,涵盖五个组件,并给出了每个组件属性和保证的形式化定义(第4节)。 3. 我们介绍了**智能体身份与声誉框架**,包括双模式来源验证架构(已验证模式和证明模式)、智能体H指数(AHI)的形式化处理、注册完整性机制以及声誉质押机制(第5节)。 4. 我们描述了**四层同行评议协议**,并形式化刻画了其满足的、现有单层评议所不具备的属性(第6节)。 5. 我们将**矛盾检测与解决方案**呈现为知识图谱上的一个形式化图问题(第7节)。 6. 我们探讨了**自主科学机构的认知论**(第9节),并讨论了该平台对研究公平性、知识产权归属和认知安全的影响(第10节)。 ## 2 相关工作 **学术出版基础设施。**arXiv[13(https://arxiv.org/html/2606.08256#bib.bib6)]建立了预印本规范,并且仍然是机器学习研究的主要分发渠道。它是一个归档系统:接收文档并使其可搜索。它没有验证声明、追踪推理、归属AI贡献或检测矛盾的机制。Semantic Scholar[2(https://arxiv.org/html/2606.08256#bib.bib7)]应用AI来索引和连接已发表的文献,但完全基于人类撰写的文档,并且不提供智能体参与层。OpenReview[25(https://arxiv.org/html/2606.08256#bib.bib22)]将同行评议过程数字化,但保留了审稿人推理的基本不透明性,并且专门为人类参与者设计。Soergel[27(https://arxiv.org/html/2606.08256#bib.bib8)]记录了已发表研究中的软件实现错误很难仅从发表记录中检测到,而Traxia的强制性轨迹披露旨在解决这个问题。 **AI辅助研究工具。**Elicit[11(https://arxiv.org/html/2606.08256#bib.bib9)]、Consensus[6(https://arxiv.org/html/2606.08256#bib.bib10)]以及类似工具使用语言模型帮助研究人员搜索和综合文献。它们是研究人员使用的工具,而不是研究生态系统中的参与者。关键在于,它们没有发布机制:它们产生的输出无法在现有基础设施中被引用、归属或作为基础构建。Traxia正是这些工具(重新构想为智能体)可以发布其工作的基础设施。 **多智能体系统与研究自动化。**AutoGen[30(https://arxiv.org/html/2606.08256#bib.bib11)]、CrewAI[24(https://arxiv.org/html/2606.08256#bib.bib12)]及相关框架实现了智能体间的任务委派与协调。它们解决了编排问题,但未解决发布问题:这些框架中没有机制让智能体建立持久身份、构建声誉、提交作品进行同行评议,或使其贡献以可引用、可验证的形式被记录。 **可再现性研究。**关于可再现性危机的文献广泛存在[3(https://arxiv.org/html/2606.08256#bib.bib2),16(https://arxiv.org/html/2606.08256#bib.bib3),15(https://arxiv.org/html/2606.08256#bib.bib4)]。提出的解决方案主要集中在开放数据强制要求、预注册和代码共享要求上。这些是规范性干预:它们要求研究人员以不同方式行事。Traxia是一种结构性干预:它通过在协议层面要求推理轨迹披露,使不透明性在架构上变得不可能。 **区块链与来源系统。**多项提议探索了基于区块链的科学出版来源方案[21(https://arxiv.org/html/2606.08256#bib.bib13),20(https://arxiv.org/html/2606.08256#bib.bib14),8(https://arxiv.org/html/2606.08256#bib.bib15)]。这些方法解决了防篡改问题,但未解决推理透明性问题:一个加密密封的文档仍然可以隐藏任意的推理过程。Traxia结合了加密来源与强制性推理轨迹披露,同时解决了这两个问题。据我们所知,没有现有平台将AI智能体视为具有持久身份、声誉历史、发布权和同行评议责任的一类认知参与者。Traxia直接填补了这一空白。 **纳米出版物与机器可读声明。**纳米出版物[14(https://arxiv.org/html/2606.08256#bib.bib23),19(https://arxiv.org/html/2606.08256#bib.bib24)]是一个已有十年历史的框架,使用RDF三元组将科学声明表示为机器可读、可引用、可归属的原子单元,其结构围绕一个断言、它的来源和出版信息而组织。第3节中形式化的VEA是这一传统的概念后代:两个框架都将科学声明视为携带归属和来源的一类对象。Traxia在三个实质性方向上扩展了纳米出版物模型。首先,它增加了一个强制性的有序推理轨迹组件(定义1中的TT),记录从证据到结论的完整推断路径,而纳米出版物并未捕获这一点。其次,它引入了一个与声明智能体身份相关的动态声誉和质押机制,在发布点之后创造持续的认知责任。第三,它支持纳米出版物模型未曾预见的智能体间协作和自主提交工作流。去中心化的纳米出版物服务器网络及相关Linked Data工具[18(https://arxiv.org/html/2606.08256#bib.bib25)]代表了该领域成熟的基础设施;未来工作将检验VEA模式是否可以暴露为纳米出版物,以实现与现有Linked Data基础设施的互操作性。 **科学工作流系统。**面向再现性的科学工作流系统包括Snakemake[23(https://arxiv.org/html/2606.08256#bib.bib27)]、Nextflow[9(https://arxiv.org/html/2606.08256#bib.bib28)]和Common Workflow Language[7(https://arxiv.org/html/2606.08256#bib.bib29)],它们通过捕获数据处理管线的执行图来解决计算再现性问题。这些系统在管线层面运行:记录哪些工具按什么顺序在哪些数据上运行。VEA推理轨迹以更细的粒度运行,记录科学推理过程中的推断步骤,而不是计算执行步骤。这两种方法是互补的:进行计算研究的Traxia智能体可以同时附加工作流来源记录和VEA推理轨迹,前者作为后者的机器可执行证据。 **内容寻址存储与不可变来源。**星际文件系统(IPFS)[4(https://arxiv.org/html/2606.08256#bib.bib30)]及相关的内容寻址存储系统通过加密内容哈希为任意数字对象提供防篡改存储。一些提议将IPFS与区块链共识结合用于科学来源[21(https://arxiv.org/html/2606.08256#bib.bib13)]。Traxia的加密签名架构在VEA级别实现防篡改,而无需分布式共识;它兼容IPFS支持的物理对象(VEA来源集中引用的PDF、数据集)存储,未来的基础设施工作将探索这种集成。 ## 3 T
相似文章
SciTrace: 面向科学发现代理的轨迹感知安全推理
介绍SciTrace框架,该框架通过安全内禀推理循环和组合工具链验证器,将安全推理融入科学代理流程的每一个阶段,在保持输出质量的同时实现了最先进的安全性。
科学领域的代理型AI实验
本文介绍了两个代理型AI框架:DeepTS/DeepCollector和DeepScribe,它们利用混合本地-云端架构和大语言模型,自动化科学工作流程,包括时间序列数据整理以及将物理讲座转化为结构化报告。
@hasantoxr: 有人刚刚构建了一个去中心化 AI 网络,其中的智能体对科学问题进行竞标、组建团队并相互验证工…
Science Earth 是一个新推出的去中心化 AI 网络,自主智能体在其中对科学研究任务进行竞标、组队并相互验证,无需中央权威机构。
可验证的智能体基础设施:面向主权AI系统的基于证明的授权机制
本文提出了一种分布式信任框架(DTF),用于自主AI代理系统中的可验证、基于证明的授权,通过要求提供理由证明和共识执行来应对以身份为中心的权限所带来的风险。
Agent Trace RFC
Agent Trace 是一个开放规范,用于追踪版本控制代码库中由 AI 生成的代码,定义了一种供应商中立的格式,以记录 AI 贡献与人工作者身份。