@AlphaSignalAI:Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

X AI KOLs Timeline 工具

摘要

AutoResearchClaw 是一个 GitHub 仓库,它能够将整个 AI 研究流程自动化——从想法到完整的会议论文,包含真实的实验、经过验证的引用和可运行的代码,在 55 个主题的基准测试中,比之前的自主研究系统性能提升 54.7%。

Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。 大多数 AI 研究工具只处理一步。而这个则是一个 GitHub 仓库,能够处理所有步骤。 AutoResearchClaw 以单个想法作为输入,输出一篇完整的会议论文,包含真实的实验、经过验证的引用和可运行的代码。 以下是中间的过程: - 自动扫描 50 多篇论文 - 三个代理辩论最佳假设 - 编写并自我调试实验代码 - 从头重写失败的假设 - 起草论文,验证每个引用 这些代理并非通用型。专业版本可接入物理学、生物学等领域的真实工具。 为了评估,团队在机器学习、物理学和生物学等 55 个主题上构建了一个基准测试。在该基准上,该仓库比之前最好的自主研究系统性能提升 54.7%。 这个周末就来试试吧。
查看原文
查看缓存全文

缓存时间: 2026/05/22 21:58

Karpathy 实现了自动化实验。AutoResearchClaw 则让整个实验室自动运转。

大多数 AI 研究工具只处理一个步骤。而这个 GitHub 仓库能处理所有步骤。

AutoResearchClaw 输入一个想法,输出一篇完整的会议论文,包含真实实验、已验证的引用和可运行的代码。

它的运行流程如下:

  • 自动扫描 50 篇以上论文
  • 三个智能体辩论最佳假设
  • 编写实验代码并自动调试
  • 重写失败的假设(从头开始)
  • 起草论文,验证每一条引用

这些智能体并非通用型。专用版本能接入物理、生物学等领域的真实工具。

为了评估该系统,团队构建了一个覆盖机器学习、物理和生物学 55 个主题的基准测试。在该基准上,该仓库的表现比之前最好的自主研究系统高 54.7%。

这个周末来试试看吧。

Huaxiu Yao (@HuaxiuYaoML): 🔥 AutoResearchClaw 技术报告 + v0.5.0 刚刚发布。

GitHub 上 12,300+ ⭐。本次发布的两大新增内容:

🧪 1/ 实验阶段的领域专家智能体:针对高能物理、生物学等领域定制的专用智能体。接入了真实的领域工具和知识——而非

相似文章

AutoResearch AI:迈向AI驱动的科学发现研究自动化

Hugging Face Daily Papers

一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。

AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现

arXiv cs.AI

本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。