@rohit4verse: 每个夜晚,如果你没有运行自主研究智能体,那你就是在手动运行别人几个月前就已经自动化的实验…
摘要
Andrej Karpathy 开源了一个自主研究智能体,它能在单张 GPU 上通宵运行自己的机器学习实验,通过编辑代码自动迭代改进,并保留那些能降低验证损失的变化。
查看缓存全文
缓存时间: 2026/05/25 12:53
每个你不在运行自主研究agent的夜晚,你都在手动运行别人几个月前就已经自动化的实验。
大多数人仍在寻找“正确”的配置。框架、编排、胶水代码。
你根本不需要这些。Andrej Karpathy 开源了他自己的版本,可以自行运行机器学习研究。一张GPU。一晚上约100次实验。你完全不需要碰Python。
以下是具体设置(只需2分钟):
- 克隆仓库:(评论中的仓库链接)
- uv sync,然后 uv run prepare[.]py
- uv run train[.]py 一次以确认基线运行
- 将你的coding agent指向program.md,然后离开
agent会编辑一个文件,训练5分钟,如果val_bpb下降则保留更改,否则回退。Git是记忆,指标是裁判。
你醒来时看到的是经过验证的改进阶梯,而不是你从未测试过的想法积压。
相似文章
@lftherios:1/ @karpathy 的 autoresearch 是今年最具代表性的智能体范式之一。问题在于……
Andrej Karpathy 的 autoresearch 范式揭示:当下 AI 智能体各自为战做实验,重复劳动、浪费算力,还不断「重新发明」死路。
@sitinme: 看到 Karpathy 开源了一个很有意思的项目autoresearch,把一个真实但小型的 LLM 训练任务交给 AI Agent,让它自己做研究、改代码、跑实验、看结果,然后决定保留还是放弃这次改动。 这个项目基于单张 NVIDIA …
Karpathy 开源了一个实验性项目 autoresearch,让 AI Agent 自动完成小规模 LLM 训练的研究循环:修改代码、运行实验、评估结果并迭代优化,人类只需编写研究计划和约束。
@JeremyNguyenPhD: “我让 3 个 AI 代理整晚独自研究一个问题,它们带回了对 72 篇同行评审论文的综述” -- @ProfJieDi…
Jie Ding 教授开源了 Autoresearch 和 WorldSeed,这是两款 AI 代理框架,能够在一夜之间自主分析 72 篇同行评审论文以解决研究问题。
@seelffff: > 自主阅读arXiv论文 > 查找并验证HF Hub数据集 > 自行编写训练脚本 > 生成…
Hugging Face 开源了 ml-intern,一个自主智能体,能够完成整个机器学习后训练循环——阅读论文、查找数据集、编写脚本、生成数据、监控训练并上传权重——在无需人工干预的情况下,使用1.7B模型在10小时内实现了显著的GPQA提升。
@rohit4verse: karpathy 从十二月起就没再写过一行代码。他把这种状态称为 AI 精神错乱。每天 16 小时向智能体表达他的意志…
据说 Andrej Karpathy 从十二月起就不再写代码,转而使用 AI 代理进行宏观层面委派、自动研究循环和家庭自动化,优化代币吞吐量,并把自己从循环中移除,让系统自主运行。