@yibie: awesome-autoresearch 更新，新增 3 条目。 dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上（CarRacing-v3），agent 可以在 tokenizer、dy…

X AI KOLs Timeline 2026/05/24 08:01 工具

摘要

awesome-autoresearch 更新，新增 dreamworld（世界模型研究）、Odyssey Engine（通用迭代引擎）、以及 Kirill Krainov 关于 agentic coding 自改进的文章。

awesome-autoresearch 更新，新增 3 条目。 dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上（CarRacing-v3），agent 可以在 tokenizer、dynamics、planning 三个环节自主做 keep/discard 实验，远端 GPU 编排走 Modal。灵感来自 AutoGo 和 Karpathy 的原始 loop。 Odyssey Engine — 融合 autoresearch（指标驱动实验）、gaggle-iterate（检查点/验证/回滚）、ralph-loop（持续执行）三种模式的通用迭代引擎，面向 Claude Code 提供 engineer/creative/production 三种策略配置。同一个 loop 能跑代码优化、写作打磨、研究探索。 Kirill Krainov 在 http://zerocopy.blog 上详细描述了如何把 autoresearch 的多指标评估（正确性、清晰度、性能、完整性）移植到 agentic coding skill 的自改进上，把 Karpathy 的 stateless keep/discard 模式用到了编程技能提升场景。 239 实现 + 116 讨论 = 355 条目 http://github.com/yibie/awesome-autoresearch…

查看原文

查看缓存全文

缓存时间: 2026/05/24 18:36

awesome-autoresearch 更新，新增 3 条目。

dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上（CarRacing-v3），agent 可以在 tokenizer、dynamics、planning 三个环节自主做 keep/discard 实验，远端 GPU 编排走 Modal。灵感来自 AutoGo 和 Karpathy 的原始 loop。

Odyssey Engine — 融合 autoresearch（指标驱动实验）、gaggle-iterate（检查点/验证/回滚）、ralph-loop（持续执行）三种模式的通用迭代引擎，面向 Claude Code 提供 engineer/creative/production 三种策略配置。同一个 loop 能跑代码优化、写作打磨、研究探索。

Kirill Krainov 在 http://zerocopy.blog 上详细描述了如何把 autoresearch 的多指标评估（正确性、清晰度、性能、完整性）移植到 agentic coding skill 的自改进上，把 Karpathy 的 stateless keep/discard 模式用到了编程技能提升场景。

239 实现 + 116 讨论 = 355 条目 http://github.com/yibie/awesome-autoresearch…

Kirill Krainov

Source: https://zerocopy.blog/ Introduction I’ve been testing Ralph loops recently for agentic coding. The idea is simple: spin up new Claude Code sessions for each task to get a fresh context until the…Read more: Autonomous AI Coding: Ralph Loops with Sub-Agents and Skills (Pt. 1)

相似文章

@yibie: awesome-autoresearch 更新，新增 6 条目。 Trace2Evolve — 把 autoresearch 用在客服 agent 的自我进化上。自动生成困难 case、评分 trace、分类失败原因，只在 benchma…

X AI KOLs Timeline

awesome-autoresearch 列表更新，新增 6 个基于 Karpathy autoresearch 模式的应用案例，涵盖客服 agent 自我进化、Shell 集成、代码配置自我优化、RAG 调优和 ASO 等场景。

@yibie: awesome-autoresearch 更新，新增 7 条目。 pi-lifeline — 一个很实用的 pi 扩展：让本地小模型跑 autoresearch，卡在瓶颈时自动向更强的模型求助。Tobi Lütke 也在 X 上提到了这个…

X AI KOLs Timeline

awesome-autoresearch 列表更新，新增7个条目，包括 pi-lifeline（本地小模型求助强模型）、Marketing Mix Modeling 12x 提升、TokenTelemetry 开源追踪工具等，覆盖多个行业的 autoresearch 应用案例。

@yibie: 本周 awesome-autoresearch 新增 3 个条目： 1. autoslam：将 Karpathy 的 autoresearch 循环应用于 LiDAR SLAM 方法设计，在 KITTI 基准上累积实验排行榜 2. Bir…

X AI KOLs Timeline

本周 awesome-autoresearch 新增三个条目，包括将 Karpathy 的 autoresearch 循环应用于 LiDAR SLAM 的 autoslam 项目，以及两篇分析原始实验并揭示指标博弈的博客文章。

@WWTLitee: 有没有什么办法让AI自主迭代优化？有，来看看这个 autoresearch 它的核心不是让 AI 直接“发明论文”，而是把研究过程拆成一个可验证循环：人类写 program.md 给研究方向，AI agent 修改 http://tra…

X AI KOLs Timeline

介绍了autoresearch项目，它将AI研究过程拆解为可验证的循环（固定环境、单一可编辑文件、固定指标、Git回滚），使AI agent能进行可控、可复现的实验迭代；同时提及了12-factor-agents清单。

@yibie: 本周 autoresearch 生态证据扫描：新增 9 条记录，总条目数达 383。 AutoResearch-RL：带 http://prepare.py/train.py 隔离的持续 RL 研究框架，支持 LLM/混合策略实验调度 l…

X AI KOLs Timeline

本周 autoresearch 生态新增 9 条记录，总条目达 383，涵盖 AutoResearch-RL 强化学习框架、lance-autoresearch 数据库内核优化、Clio 预测市场回测框架等多个开源工具和项目。

Kirill Krainov

相似文章

@yibie: awesome-autoresearch 更新，新增 6 条目。 Trace2Evolve — 把 autoresearch 用在客服 agent 的自我进化上。自动生成困难 case、评分 trace、分类失败原因，只在 benchma…

@yibie: awesome-autoresearch 更新，新增 7 条目。 pi-lifeline — 一个很实用的 pi 扩展：让本地小模型跑 autoresearch，卡在瓶颈时自动向更强的模型求助。Tobi Lütke 也在 X 上提到了这个…

@yibie: 本周 awesome-autoresearch 新增 3 个条目： 1. autoslam：将 Karpathy 的 autoresearch 循环应用于 LiDAR SLAM 方法设计，在 KITTI 基准上累积实验排行榜 2. Bir…

@WWTLitee: 有没有什么办法让AI自主迭代优化？ 有，来看看这个 autoresearch 它的核心不是让 AI 直接“发明论文”，而是把研究过程拆成一个可验证循环：人类写 program.md 给研究方向，AI agent 修改 http://tra…

@yibie: 本周 autoresearch 生态证据扫描：新增 9 条记录，总条目数达 383。 AutoResearch-RL：带 http://prepare.py/train.py 隔离的持续 RL 研究框架，支持 LLM/混合策略实验调度 l…

提交意见反馈

@WWTLitee: 有没有什么办法让AI自主迭代优化？有，来看看这个 autoresearch 它的核心不是让 AI 直接“发明论文”，而是把研究过程拆成一个可验证循环：人类写 program.md 给研究方向，AI agent 修改 http://tra…