AutoResearchClaw:自我强化的自主研究与人机协作

Hugging Face Daily Papers 论文

摘要

AutoResearchClaw是一个多智能体自主研究系统,通过结构化辩论、自我修复执行和人机协作来改进科学发现,在ARC-Bench基准上比之前的系统高出54.7%。

实现科学发现的自动化不仅仅是从想法生成论文。真正的研究是迭代的:假说从多个角度受到挑战,实验失败并为下一次尝试提供信息,经验在循环中积累。现有的自主研究系统通常将此过程建模为线性流水线:它们依赖单智能体推理,在执行失败时停止,并且不跨运行传递经验。我们提出了AutoResearchClaw,一个基于五种机制的多智能体自主研究流水线:用于假说生成和结果分析的结构化多智能体辩论;具有Pivot/Refine决策循环的自我修复执行器,将失败转化为信息;可验证的结果报告,防止捏造的数字和幻觉引用;包含七种干预模式的人机协同协作,从完全自主到逐步监督;以及跨运行进化,将过去的错误转化为未来的保障。在ARC-Bench(一个包含25个主题的实验阶段基准)上,AutoResearchClaw比AI Scientist v2高出54.7%。对七种干预模式进行的人机协同消融实验表明,在高杠杆决策点进行的精确、有针对性的协作始终优于完全自主和详尽逐步监督。我们将AutoResearchClaw定位为一种研究放大器,它增强而非取代人类的科学判断。代码可在 https://github.com/aiming-lab/AutoResearchClaw 获取。
查看原文
查看缓存全文

缓存时间: 2026/05/20 02:35

论文页面 - AutoResearchClaw:基于人机协作的自我强化自主研究

来源:https://huggingface.co/papers/2605.20025 作者:

, , , , , , , , , , , , , , , , , , , ,

摘要

AutoResearchClaw 是一个多智能体自主研究系统,通过结构化辩论、自修复执行、可验证报告、人机协作和跨轮进化学习,在基准测试中超越了以往系统,同时保持人类监督,从而改进科学发现。

自动化科学发现不仅仅是根据想法生成论文。真实的研究是迭代的:假设会从多个角度受到挑战,实验失败后为下一次尝试提供信息,并且经验会在不同轮次中积累。现有的自主研究系统通常将此过程建模为线性流水线:它们依赖单智能体推理,在执行失败时停止,并且不会跨轮次携带经验。我们提出了 AutoResearchClaw,这是一个基于五种机制构建的多智能体自主研究(https://huggingface.co/papers?q=multi-agent%20autonomous%20research)流水线:用于假设生成和结果分析的结构化多智能体辩论(https://huggingface.co/papers?q=structured%20multi-agent%20debate);带有 Pivot/Refine 决策循环的自修复执行器(https://huggingface.co/papers?q=self-healing%20executor),将失败转化为信息;可验证结果报告(https://huggingface.co/papers?q=verifiable%20result%20reporting),防止伪造数字和虚构引用;人机协作(https://huggingface.co/papers?q=human-in-the-loop%20collaboration),提供七种干预模式,涵盖从完全自主到逐步监督;以及跨轮次进化(https://huggingface.co/papers?q=cross-run%20evolution),将过去的错误转化为未来的保障。在包含 25 个主题的实验阶段基准测试 ARC-Bench(https://huggingface.co/papers?q=ARC-Bench)上,AutoResearchClaw 比 AI Scientist v2(https://huggingface.co/papers?q=AI%20Scientist%20v2)提升了 54.7%。通过七种干预模式进行的人机协作消融实验表明,在高杠杆决策点进行精确、有针对性的协作始终优于完全自主和详尽的逐步监督。我们将 AutoResearchClaw 定位为一种研究放大器,它增强而非取代人类的科学判断。代码地址:https://github.com/aiming-lab/AutoResearchClaw。

查看 arXiv 页面(https://arxiv.org/abs/2605.20025)查看 PDF(https://arxiv.org/pdf/2605.20025)项目页面(https://github.com/aiming-lab/AutoResearchClaw)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.20025)

在您的智能体中获取此论文:

hf papers read 2605\.20025

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型 0

没有模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2605.20025 以将其链接到此页面。

引用此论文的数据集 0

没有数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2605.20025 以将其链接到此页面。

引用此论文的 Spaces 0

没有 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2605.20025 以将其链接到此页面。

包含此论文的收藏 0

没有收藏包含此论文

将此论文添加到一个收藏(https://huggingface.co/new-collection)以将其链接到此页面。

相似文章

AutoResearch AI:迈向AI驱动的科学发现研究自动化

Hugging Face Daily Papers

一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。

AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现

arXiv cs.AI

本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。