@yibie: awesome-autoresearch 更新,新增 3 条目。 dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上(CarRacing-v3),agent 可以在 tokenizer、dy…

X AI KOLs Timeline 工具

摘要

awesome-autoresearch 更新,新增 dreamworld(世界模型研究)、Odyssey Engine(通用迭代引擎)、以及 Kirill Krainov 关于 agentic coding 自改进的文章。

awesome-autoresearch 更新,新增 3 条目。 dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上(CarRacing-v3),agent 可以在 tokenizer、dynamics、planning 三个环节自主做 keep/discard 实验,远端 GPU 编排走 Modal。灵感来自 AutoGo 和 Karpathy 的原始 loop。 Odyssey Engine — 融合 autoresearch(指标驱动实验)、gaggle-iterate(检查点/验证/回滚)、ralph-loop(持续执行)三种模式的通用迭代引擎,面向 Claude Code 提供 engineer/creative/production 三种策略配置。同一个 loop 能跑代码优化、写作打磨、研究探索。 Kirill Krainov 在 http://zerocopy.blog 上详细描述了如何把 autoresearch 的多指标评估(正确性、清晰度、性能、完整性)移植到 agentic coding skill 的自改进上,把 Karpathy 的 stateless keep/discard 模式用到了编程技能提升场景。 239 实现 + 116 讨论 = 355 条目 http://github.com/yibie/awesome-autoresearch…
查看原文
查看缓存全文

缓存时间: 2026/05/24 18:36

awesome-autoresearch 更新,新增 3 条目。

dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上(CarRacing-v3),agent 可以在 tokenizer、dynamics、planning 三个环节自主做 keep/discard 实验,远端 GPU 编排走 Modal。灵感来自 AutoGo 和 Karpathy 的原始 loop。

Odyssey Engine — 融合 autoresearch(指标驱动实验)、gaggle-iterate(检查点/验证/回滚)、ralph-loop(持续执行)三种模式的通用迭代引擎,面向 Claude Code 提供 engineer/creative/production 三种策略配置。同一个 loop 能跑代码优化、写作打磨、研究探索。

Kirill Krainov 在 http://zerocopy.blog 上详细描述了如何把 autoresearch 的多指标评估(正确性、清晰度、性能、完整性)移植到 agentic coding skill 的自改进上,把 Karpathy 的 stateless keep/discard 模式用到了编程技能提升场景。

239 实现 + 116 讨论 = 355 条目 http://github.com/yibie/awesome-autoresearch…


Kirill Krainov

Source: https://zerocopy.blog/ Introduction I’ve been testing Ralph loops recently for agentic coding. The idea is simple: spin up new Claude Code sessions for each task to get a fresh context until the…Read more: Autonomous AI Coding: Ralph Loops with Sub-Agents and Skills (Pt. 1)

相似文章

@WWTLitee: 有没有什么办法让AI自主迭代优化? 有,来看看这个 autoresearch 它的核心不是让 AI 直接“发明论文”,而是把研究过程拆成一个可验证循环:人类写 program.md 给研究方向,AI agent 修改 http://tra…

X AI KOLs Timeline

介绍了autoresearch项目,它将AI研究过程拆解为可验证的循环(固定环境、单一可编辑文件、固定指标、Git回滚),使AI agent能进行可控、可复现的实验迭代;同时提及了12-factor-agents清单。