介绍 FLYWHEEL.md 🌀
摘要
FLYWHEEL.md 引入了一个基于循环的自主编码框架,AI 代理自主交付软件,但在关键决策点通过人工门控检查点停止,将 Karpathy 的 AutoResearch 循环应用于实际软件部署。
自主编码刚刚跨越了一个界限。Claude Code、Cursor、Codex、OpenClaw —— 这个列表还在不断增长,而且它们现在都可以完全自主运行:/loop、/goal、crons。代理可以全天候交付软件。这是令人难以置信的力量,我们必须负责任地使用它。**Andrej Karpathy** 的 AutoResearch 展示了 ML 研究的循环:一个代理可以在夜间运行实验,保留有效的结果,整个过程无需人类干预。**FLYWHEEL.md** 就是同样的循环,应用于实际软件的交付,让你在关键的门控点保留人工判断。编写代码从来都不是难点。难点在于之后的一切:交付、在生产环境中验证其有效性、了解哪里出了问题、进行改进。这就是一个循环。该代理仓库正在汇聚成一个精简的规范:• **AGENTS.md**:做什么 • **SOUL.md**:成为什么 • **FLYWHEEL.md**:如何交付,以及如何知道你已经完成 **FLYWHEEL.md** 不是一个“完成标准”的检查清单。它是你的循环,带有门控。每个阶段都会说明:当____时完成,以及:代理是继续执行,还是等待人工决策?它是一份总结你如何运行整个自主流水线的文档:一个用于审查、管理和更新的文件。代理转动轮子。你来控制关键环节的转动。一个 CLI、一个模型和一个 Web 服务各自拥有不同的循环。它就是一个文件。采用 MIT 许可证。给你的代理一个可以转动的轮子,以及一个可以停下的地方。
相似文章
FlyRoute:通过数据飞轮实现自适应任务路由的自我进化代理画像
FlyRoute是一种自我进化的画像框架,通过动态更新来自实际流量的代理能力描述,改进多智能体系统中基于LLM的任务路由,相比静态画像取得了显著的准确率提升。
@hwchase17: https://x.com/hwchase17/status/2053157547985834227
文章概述了一个系统的“智能体开发生命周期”(构建、测试、部署、监控),以有效创建和管理 AI 智能体,重点介绍了 LangChain、LangGraph 和 CrewAI 等关键框架。
@rohit4verse: 构建可交付的“弱智”AI 循环是目前智能体系统的核心护城河。88% 的代理试点项目采用这种模式,但……
文章讨论了智能体 AI 系统中的常见失败模式,特别是“弱智 AI 循环”,并引用了在 Claude Code 部署中观察到的状态污染和数据泄露等问题。
当AI代理自主执行编码任务时,人类应该处于循环中的哪个位置?
讨论了在自主AI编码代理工作流中人类审查的最佳位置,考虑了自动化与安全性之间的权衡,特别是针对认证、支付和数据库迁移等风险较高的系统。
大规模生产代码库中的代理式编码:成功、失败模式与防护措施
来自数据库、iOS、前端、数据工程和后端领域的工程师讨论了AI代码生成如何将难点转移到验证和集成上,需要人类对细微风险和架构适配性做出判断。