@AlphaSignalAI：Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

X AI KOLs Timeline 2026/05/22 07:05 工具

auto-research ai-research github open-source agents paper-generation benchmark

摘要

AutoResearchClaw 是一个 GitHub 仓库，它能够将整个 AI 研究流程自动化——从想法到完整的会议论文，包含真实的实验、经过验证的引用和可运行的代码，在 55 个主题的基准测试中，比之前的自主研究系统性能提升 54.7%。

Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。而这个则是一个 GitHub 仓库，能够处理所有步骤。 AutoResearchClaw 以单个想法作为输入，输出一篇完整的会议论文，包含真实的实验、经过验证的引用和可运行的代码。以下是中间的过程： - 自动扫描 50 多篇论文 - 三个代理辩论最佳假设 - 编写并自我调试实验代码 - 从头重写失败的假设 - 起草论文，验证每个引用这些代理并非通用型。专业版本可接入物理学、生物学等领域的真实工具。为了评估，团队在机器学习、物理学和生物学等 55 个主题上构建了一个基准测试。在该基准上，该仓库比之前最好的自主研究系统性能提升 54.7%。这个周末就来试试吧。

查看原文

查看缓存全文

缓存时间: 2026/05/22 21:58

Karpathy 实现了自动化实验。AutoResearchClaw 则让整个实验室自动运转。

大多数 AI 研究工具只处理一个步骤。而这个 GitHub 仓库能处理所有步骤。

AutoResearchClaw 输入一个想法，输出一篇完整的会议论文，包含真实实验、已验证的引用和可运行的代码。

它的运行流程如下：

自动扫描 50 篇以上论文
三个智能体辩论最佳假设
编写实验代码并自动调试
重写失败的假设（从头开始）
起草论文，验证每一条引用

这些智能体并非通用型。专用版本能接入物理、生物学等领域的真实工具。

为了评估该系统，团队构建了一个覆盖机器学习、物理和生物学 55 个主题的基准测试。在该基准上，该仓库的表现比之前最好的自主研究系统高 54.7%。

这个周末来试试看吧。

Huaxiu Yao (@HuaxiuYaoML)： 🔥 AutoResearchClaw 技术报告 + v0.5.0 刚刚发布。

GitHub 上 12,300+ ⭐。本次发布的两大新增内容：

🧪 1/ 实验阶段的领域专家智能体：针对高能物理、生物学等领域定制的专用智能体。接入了真实的领域工具和知识——而非

@AlphaSignalAI：Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

相似文章

@rohanpaul_ai: Meta、斯坦福、谷歌等多家顶级实验室的新论文提出了AutoResearchClaw。表明自动化研究改进…

AutoResearchClaw：自我强化的自主研究与人机协作

AutoResearch AI：迈向AI驱动的科学发现研究自动化

AutoResearch AI：迈向人工智能驱动的研究自动化以实现科学发现

@lftherios：1/ @karpathy 的 autoresearch 是今年最具代表性的智能体范式之一。问题在于……

提交意见反馈