@yibie: awesome-autoresearch 更新,新增 3 条目。 dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上(CarRacing-v3),agent 可以在 tokenizer、dy…
摘要
awesome-autoresearch 更新,新增 dreamworld(世界模型研究)、Odyssey Engine(通用迭代引擎)、以及 Kirill Krainov 关于 agentic coding 自改进的文章。
查看缓存全文
缓存时间: 2026/05/24 18:36
awesome-autoresearch 更新,新增 3 条目。
dreamworld — 世界模型研究。把 autoresearch 循环用到像素级世界模型训练上(CarRacing-v3),agent 可以在 tokenizer、dynamics、planning 三个环节自主做 keep/discard 实验,远端 GPU 编排走 Modal。灵感来自 AutoGo 和 Karpathy 的原始 loop。
Odyssey Engine — 融合 autoresearch(指标驱动实验)、gaggle-iterate(检查点/验证/回滚)、ralph-loop(持续执行)三种模式的通用迭代引擎,面向 Claude Code 提供 engineer/creative/production 三种策略配置。同一个 loop 能跑代码优化、写作打磨、研究探索。
Kirill Krainov 在 http://zerocopy.blog 上详细描述了如何把 autoresearch 的多指标评估(正确性、清晰度、性能、完整性)移植到 agentic coding skill 的自改进上,把 Karpathy 的 stateless keep/discard 模式用到了编程技能提升场景。
239 实现 + 116 讨论 = 355 条目 http://github.com/yibie/awesome-autoresearch…
Kirill Krainov
Source: https://zerocopy.blog/ Introduction I’ve been testing Ralph loops recently for agentic coding. The idea is simple: spin up new Claude Code sessions for each task to get a fresh context until the…Read more: Autonomous AI Coding: Ralph Loops with Sub-Agents and Skills (Pt. 1)
相似文章
@yibie: awesome-autoresearch 更新,新增 6 条目。 Trace2Evolve — 把 autoresearch 用在客服 agent 的自我进化上。自动生成困难 case、评分 trace、分类失败原因,只在 benchma…
awesome-autoresearch 列表更新,新增 6 个基于 Karpathy autoresearch 模式的应用案例,涵盖客服 agent 自我进化、Shell 集成、代码配置自我优化、RAG 调优和 ASO 等场景。
@yibie: awesome-autoresearch 更新,新增 7 条目。 pi-lifeline — 一个很实用的 pi 扩展:让本地小模型跑 autoresearch,卡在瓶颈时自动向更强的模型求助。Tobi Lütke 也在 X 上提到了这个…
awesome-autoresearch 列表更新,新增7个条目,包括 pi-lifeline(本地小模型求助强模型)、Marketing Mix Modeling 12x 提升、TokenTelemetry 开源追踪工具等,覆盖多个行业的 autoresearch 应用案例。
@yibie: 本周 awesome-autoresearch 新增 3 个条目: 1. autoslam:将 Karpathy 的 autoresearch 循环应用于 LiDAR SLAM 方法设计,在 KITTI 基准上累积实验排行榜 2. Bir…
本周 awesome-autoresearch 新增三个条目,包括将 Karpathy 的 autoresearch 循环应用于 LiDAR SLAM 的 autoslam 项目,以及两篇分析原始实验并揭示指标博弈的博客文章。
@WWTLitee: 有没有什么办法让AI自主迭代优化? 有,来看看这个 autoresearch 它的核心不是让 AI 直接“发明论文”,而是把研究过程拆成一个可验证循环:人类写 program.md 给研究方向,AI agent 修改 http://tra…
介绍了autoresearch项目,它将AI研究过程拆解为可验证的循环(固定环境、单一可编辑文件、固定指标、Git回滚),使AI agent能进行可控、可复现的实验迭代;同时提及了12-factor-agents清单。
@yibie: 本周 autoresearch 生态证据扫描:新增 9 条记录,总条目数达 383。 AutoResearch-RL:带 http://prepare.py/train.py 隔离的持续 RL 研究框架,支持 LLM/混合策略实验调度 l…
本周 autoresearch 生态新增 9 条记录,总条目达 383,涵盖 AutoResearch-RL 强化学习框架、lance-autoresearch 数据库内核优化、Clio 预测市场回测框架等多个开源工具和项目。