@AlphaSignalAI:Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……
摘要
AutoResearchClaw 是一个 GitHub 仓库,它能够将整个 AI 研究流程自动化——从想法到完整的会议论文,包含真实的实验、经过验证的引用和可运行的代码,在 55 个主题的基准测试中,比之前的自主研究系统性能提升 54.7%。
查看缓存全文
缓存时间: 2026/05/22 21:58
Karpathy 实现了自动化实验。AutoResearchClaw 则让整个实验室自动运转。
大多数 AI 研究工具只处理一个步骤。而这个 GitHub 仓库能处理所有步骤。
AutoResearchClaw 输入一个想法,输出一篇完整的会议论文,包含真实实验、已验证的引用和可运行的代码。
它的运行流程如下:
- 自动扫描 50 篇以上论文
- 三个智能体辩论最佳假设
- 编写实验代码并自动调试
- 重写失败的假设(从头开始)
- 起草论文,验证每一条引用
这些智能体并非通用型。专用版本能接入物理、生物学等领域的真实工具。
为了评估该系统,团队构建了一个覆盖机器学习、物理和生物学 55 个主题的基准测试。在该基准上,该仓库的表现比之前最好的自主研究系统高 54.7%。
这个周末来试试看吧。
Huaxiu Yao (@HuaxiuYaoML): 🔥 AutoResearchClaw 技术报告 + v0.5.0 刚刚发布。
GitHub 上 12,300+ ⭐。本次发布的两大新增内容:
🧪 1/ 实验阶段的领域专家智能体:针对高能物理、生物学等领域定制的专用智能体。接入了真实的领域工具和知识——而非
相似文章
@rohanpaul_ai: Meta、斯坦福、谷歌等多家顶级实验室的新论文提出了AutoResearchClaw。表明自动化研究改进…
来自Meta、斯坦福和谷歌的一篇新论文提出了AutoResearchClaw,该方法通过整合故障恢复、辩论和选择性人工输入来改进自动化研究。它在ARC-Bench上以54.7%的优势超越了AI Scientist v2,并揭示了当受到过程约束而非无限自由时,自主性会得到增强。
AutoResearchClaw:自我强化的自主研究与人机协作
AutoResearchClaw是一个多智能体自主研究系统,通过结构化辩论、自我修复执行和人机协作来改进科学发现,在ARC-Bench基准上比之前的系统高出54.7%。
AutoResearch AI:迈向AI驱动的科学发现研究自动化
一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。
AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现
本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。
@lftherios:1/ @karpathy 的 autoresearch 是今年最具代表性的智能体范式之一。问题在于……
Andrej Karpathy 的 autoresearch 范式揭示:当下 AI 智能体各自为战做实验,重复劳动、浪费算力,还不断「重新发明」死路。