AutoResearchClaw:自我强化的自主研究与人机协作
摘要
AutoResearchClaw是一个多智能体自主研究系统,通过结构化辩论、自我修复执行和人机协作来改进科学发现,在ARC-Bench基准上比之前的系统高出54.7%。
查看缓存全文
缓存时间: 2026/05/20 02:35
论文页面 - AutoResearchClaw:基于人机协作的自我强化自主研究
来源:https://huggingface.co/papers/2605.20025 作者:
, , , , , , , , , , , , , , , , , , , ,
摘要
AutoResearchClaw 是一个多智能体自主研究系统,通过结构化辩论、自修复执行、可验证报告、人机协作和跨轮进化学习,在基准测试中超越了以往系统,同时保持人类监督,从而改进科学发现。
自动化科学发现不仅仅是根据想法生成论文。真实的研究是迭代的:假设会从多个角度受到挑战,实验失败后为下一次尝试提供信息,并且经验会在不同轮次中积累。现有的自主研究系统通常将此过程建模为线性流水线:它们依赖单智能体推理,在执行失败时停止,并且不会跨轮次携带经验。我们提出了 AutoResearchClaw,这是一个基于五种机制构建的多智能体自主研究(https://huggingface.co/papers?q=multi-agent%20autonomous%20research)流水线:用于假设生成和结果分析的结构化多智能体辩论(https://huggingface.co/papers?q=structured%20multi-agent%20debate);带有 Pivot/Refine 决策循环的自修复执行器(https://huggingface.co/papers?q=self-healing%20executor),将失败转化为信息;可验证结果报告(https://huggingface.co/papers?q=verifiable%20result%20reporting),防止伪造数字和虚构引用;人机协作(https://huggingface.co/papers?q=human-in-the-loop%20collaboration),提供七种干预模式,涵盖从完全自主到逐步监督;以及跨轮次进化(https://huggingface.co/papers?q=cross-run%20evolution),将过去的错误转化为未来的保障。在包含 25 个主题的实验阶段基准测试 ARC-Bench(https://huggingface.co/papers?q=ARC-Bench)上,AutoResearchClaw 比 AI Scientist v2(https://huggingface.co/papers?q=AI%20Scientist%20v2)提升了 54.7%。通过七种干预模式进行的人机协作消融实验表明,在高杠杆决策点进行精确、有针对性的协作始终优于完全自主和详尽的逐步监督。我们将 AutoResearchClaw 定位为一种研究放大器,它增强而非取代人类的科学判断。代码地址:https://github.com/aiming-lab/AutoResearchClaw。
查看 arXiv 页面(https://arxiv.org/abs/2605.20025)查看 PDF(https://arxiv.org/pdf/2605.20025)项目页面(https://github.com/aiming-lab/AutoResearchClaw)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.20025)
在您的智能体中获取此论文:
hf papers read 2605\.20025
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型 0
没有模型链接此论文
在模型 README.md 中引用 arxiv.org/abs/2605.20025 以将其链接到此页面。
引用此论文的数据集 0
没有数据集链接此论文
在数据集 README.md 中引用 arxiv.org/abs/2605.20025 以将其链接到此页面。
引用此论文的 Spaces 0
没有 Space 链接此论文
在 Space README.md 中引用 arxiv.org/abs/2605.20025 以将其链接到此页面。
包含此论文的收藏 0
没有收藏包含此论文
将此论文添加到一个收藏(https://huggingface.co/new-collection)以将其链接到此页面。
相似文章
@rohanpaul_ai: Meta、斯坦福、谷歌等多家顶级实验室的新论文提出了AutoResearchClaw。表明自动化研究改进…
来自Meta、斯坦福和谷歌的一篇新论文提出了AutoResearchClaw,该方法通过整合故障恢复、辩论和选择性人工输入来改进自动化研究。它在ARC-Bench上以54.7%的优势超越了AI Scientist v2,并揭示了当受到过程约束而非无限自由时,自主性会得到增强。
@AlphaSignalAI:Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……
AutoResearchClaw 是一个 GitHub 仓库,它能够将整个 AI 研究流程自动化——从想法到完整的会议论文,包含真实的实验、经过验证的引用和可运行的代码,在 55 个主题的基准测试中,比之前的自主研究系统性能提升 54.7%。
AutoResearch AI:迈向AI驱动的科学发现研究自动化
一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。
AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现
本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。
ARIS:通过对抗性多智能体协作实现自主研究
ARIS 是一个开源研究框架,利用跨模型的对抗性协作,通过协调执行、编排和保障层,确保长期研究结果的可靠性。