@mvanhorn: https://x.com/mvanhorn/status/2063865685558903149
摘要
本文解释了AI编程中'循环'的概念,即开发者编写程序来提示编码代理,而不是手动提示,这一概念由Peter Steinberger和Boris Cherny推广开来,并讨论了这种转变如何代表了AI辅助开发中的新抽象层。
查看缓存全文
缓存时间: 2026/06/08 13:20
WTF 是循环?Peter Steinberger 对阵 Boris Cherny
本周 AI 编程领域被反复提及的一句话只有六个词,但几乎每个说这句话的人都无法定义它。一条推文本周让整个时间线陷入狂热,所以我用 /last30days 搜索了大家争论不休的那个词。答案是真实的,它已有五年的发展脉络,而关键点是:现在昂贵的不是模型,而是循环。
让时间线沦陷的那条推文
一条推文让整个 AI 编程时间线本周都为之着迷。Peter Steinberger 在 6 月 7 日发布了它,浏览量超过 220 万,评论栏里则演变成了一场关于它实际含义的争吵。
“这是你每月的提醒:你不应该再提示编码代理了。你应该设计循环来提示你的代理。”
@steipete,2026 年 6 月 7 日
这就是每个人都在引用的那句话。最意味深长的回复来自 Varadh Jain,他问出了唯一重要的问题:这在实践中是什么样子?而成为整个氛围的答案是 Matthew Berman 的。
“除了他和 Boris,没人知道。”
@MatthewBerman,2026 年 6 月 7 日
这才是真实的故事。不是循环是未来,而是一个六个词的说法达到了两百万的浏览量,同时推广它的人却在评论里争论它到底是什么意思。我没有翻白眼,因为我每天晚上都在运行一个循环,在我睡觉时跨大约三十个开源仓库打开拉取请求。短短九十秒的调查就找回了十五个 Reddit 帖子、二十一个 X 推文和一个令人不安的模式:AI 编程中最响亮的概念,大多数重复它的人却无法解释。一派人大喊提示工程已死。另一派人,那些真正把手放在键盘上的人,则更为谨慎。
“这不是 ralph/goal 循环,那现在已经过时了。可能是某种持续编排循环,负责监督其他线程/代理。”
@trashpandaemoji,2026 年 6 月 7 日
这条回复是所有人发布的最接近正确答案的内容。记好它。
循环到底是什么
Boris Cherny 在 2024 年 9 月将 Claude Code 作为副项目创建。据报道,它目前为 GitHub 上近 4% 的公共提交提供支持。在 6 月 2 日由 WorkOS 主办的 Acquired Unplugged 活动上,他给出了你能找到的最清晰的循环定义。
“现在我认为它又升级了,到了下一波抽象,我不再提示 Claude 了。我有循环在运行。它们是那些提示 Claude 并决定做什么的东西。我的工作是写循环。”
Boris Cherny,WorkOS Acquired Unplugged,2026 年 6 月 2 日
所以,这里是平实的版本。循环是一个你编写的小程序,它为你提示编码代理,读取它生成的内容,判断是否完成,如果没有完成,就再次提示它。你不再是循环内部输入提示的那个人。你变成了循环的作者。模型变成了一个子程序。
Boris 将其分为三个阶段,你最能理解的方式就是看自己处于他的梯子的哪一级。一年前,他靠自动补全手动写代码。然后他并行运行五到十个 Claude 会话,并逐个提示每个会话。现在他根本不提示了。他编写循环来提示 Claude,而几百个代理读取他的 GitHub、Slack 和 Twitter,然后决定接下来要构建什么。他有证据。
“在过去 30 天里,我对 Claude Code 的 100% 贡献都是由 Claude Code 编写的。我完成了 259 个拉取请求。”
Boris Cherny,通过 Simon Willison,2025 年 12 月 27 日
他在 11 月删除了他的 IDE,并且从那以后再也没有打开过。提示工程已死那帮人忽略的细微差别在于:他并不是说工程师已经过时了。仍然需要有人决定构建什么、与客户交谈并协调团队,他说优秀的工程师比以往任何时候都更重要。工作并没有消失,只是在更高的抽象层次上移动了一级:从编写代码变成了编写编写代码的东西。
光谱:从 ReAct 到编排
评论之所以混乱,是因为“循环”一词至少隐藏了五种不同的东西。以下是从最旧到最新的梯子,这样你们就不会再互相误解了。
第一阶段是学术意义上的 while 循环。2022 年的 ReAct 论文将其形式化:模型推理、调用工具、读取结果、重复直到完成。一个模型,一个循环,一个人类在监控。第二阶段是 2023 年的 AutoGPT,它给循环一个目标并让它自我提示,结果却因永远空转而不做任何事而闻名。那次失败奠定了“代理只是个玩具”这种说法的基础。
第三阶段是 Trash Panda 称为“老套”的那一种:ralph 循环,由 Geoffrey Huntley 在 2025 年 7 月发布。它简单得近乎荒唐,是一个 bash 单行命令,反复将同一个提示文件输入给代理。它真正的创新在于纪律:每次迭代都将上下文重置为一组固定的锚定文件,而不是让对话无限增长。Huntley 用它构建了一整门编程语言,只花了大约 297 美元。第四阶段将其产品化:2026 年春天,Codex 和 Claude Code 都推出了 /goal 命令,运行 ralph 循环,直到一个小型的验证器模型确认任务完成。
第五阶段才是 Boris 和 Steinberger 真正所指的,它确实是全新的,而不仅仅是改名而已。有四件事发生了变化。循环成为工作单位,而不是任务。循环开始同时并按计划监督其他循环。调度取代了人类的启动,因此循环在基础设施时间上运行,而不是依赖你的注意力。持久性变成了显式特性,带有 Git 支持的状态和崩溃恢复,因为这些循环必须能在重启后幸存。ralph 假设你的终端始终开着。2026 年的版本则假定它不会一直开着。所以 Trash Panda 两次说对了:单代理的 ralph 循环是老套,而在此基础上构建的多代理编排循环才是新事物。
它只是戴了顶帽子的 cron 作业
整个语料库中最好的怀疑论者观点只有四个词,发布在有人吹嘘循环是未来方向的帖子下面。
“Cron 作业现在正经历有趣的重新命名。”
X 回复,循环讨论,2026 年 6 月
这值得一个直接的回答,而不是回避,因为它说对了一半。是的,调度层就是 cron。Boris 实际上就是在 cron 上运行他的循环。Claude Code 中的 /loop 命令在底层也使用了 cron。如果你对循环的全部定义就是一个按定时器运行的东西,那么没错,我们早在 1975 年就发明了它,你可以回家了。
Cron 从未拥有的是中间的部分。一个 cron 作业运行一个固定的脚本。一个循环则运行一个模型,该模型查看当前状态,决定下一步做什么,执行它,检查是否成功,然后决定是否继续。决策是由代理做出的,而不是你,也不是硬编码的分支。将这些堆叠起来,让一个循环调度并监督其他循环,赋予它们持久化的共享状态,你就拥有了 cron 无法表达的东西。诚实的框架既不是循环是新魔法,也不是循环只是 cron。而是:循环是 cron 加上体内的决策者,而有趣的工程在于围绕那个决策所构建的一切,以防止它跑偏。
当你真正构建一个循环时它是什么样子
理论够了。入门路径只有一行。Claude Code 发布了 /loop,而 Boris 自己的例子就是标准的起点。复制这段并更改名词。
/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.
这是他更完整的配方。几天后,Boris 发布了五个自主运行 Opus 数小时或数天的技巧。
五个技巧,用他自己的话说:使用自动模式处理权限,这样 Claude 就不需要请求批准;使用动态工作流让 Claude 编排成百上千个代理来完成一个任务;使用 /goal 或 /loop 来推动 Claude 继续工作直到完成;在云端使用 Claude Code,这样你就可以合上笔记本电脑;并确保 Claude 有一种方法可以端到端地自我验证其工作。
@bcherny,2026 年 6 月
第五条是炒作忽略而实践者痴迷的那一条:循环的可靠性完全取决于它检查自己工作的能力。
这就是整个想法的微缩版。你没有编写步骤。你编写的是意图和停止行为,然后循环每个周期提示代理。在 TikTok 上,这个框架对普通观众来说很清晰。
“循环模式是 AI 编程正在从一次性提示转向后台操作的最明确迹象之一。”
@ai.native.founder 在 TikTok 上,2026 年 6 月
最深入的一端是 Steve Yegge 的 Gas Town,1 月发布:由二十到三十个 Claude Code 实例组成,由一个 Mayor 代理协调,加上运行持续循环的巡逻代理,状态存储在 Git 中,这样工作可以在崩溃后幸存。这就是 Trash Panda 试图表达的“监督其他线程的持续编排循环”,已经发布并开源。
但研究中给出的最实用的教训是:循环的好坏完全取决于它自我检查的能力。增长最快的子主题不是编排,而是验证。
“你的编码代理可以快速行动,但糟糕的提交也会快速累积。”
@DanKornas,2026 年 6 月
Kornas 正在推出 roborev,一个在后台审查每个提交的工具,并在上下文仍然新鲜时将审查结果反馈给代理。一个编写代码却没有反馈的开放循环,就是一个生成自信错误的机器。一个编写、运行、读取结果并修正的循环,才是真正有效的东西。魔法不在于循环本身,而在于循环内部的反馈。
情节转折:循环现在变成了昂贵的部分
这里研究从哲学问题变成了财务问题。整个代理神话最犀利的戳破来自一位工作工程师。
“我今年发布的每个 AI 代理都是一个 for 循环、一次 LLM 调用和一个围绕 JSON 解析的 try/catch。唯一具有‘代理性’的是月底来自 Anthropic 的账单。”
@rohit_jsfreaky,2026 年 6 月
那个账单可不是开玩笑。本月的账单证据:Uber 将工程师使用 Claude Code 和 Cursor 的每月每人每工具支出上限设为 1500 美元,因为其年度 AI 预算在四个月内就烧光了。一旦模型几乎免费地编写代码,成本就转移到了运行它的循环上。
“AI 编码中最昂贵的部分不再是编写代码,而是管理代理循环。”
@runes_leo,2026 年 6 月
而每个在生产环境中的人都害怕的失败模式是永不停止的循环。
“没有护栏,你就会得到无限循环和超出预算几个数量级的账单惊喜。”
@cv_usk,2026 年 6 月
这就是为什么每一个严肃的 2026 年关于循环的文章最终都会归结到相同的三个硬性停止条件:最大迭代次数、无进展检测以及令牌或美元预算上限。浪漫版本的循环是:你编写循环,一千个代理一夜之间为你打造公司。生产版本的循环是:你编写循环,而你的大部分工作是确保它们停下来。Gartner 将代理式 AI 置于期望膨胀的顶峰,实际上只有约 17% 的组织真正部署了代理。时间线投入和实际账单之间的差距,才是真实的状态。
不是循环,而是技能
这是我个人的看法,也是我在观察了一周后最终得出的结论。循环是管道。真正有价值的资产是它调用的技能。
Steinberger 另一个反复出现的观点与循环观点相辅相成,而且更为持久:如果你做某件事超过一次,就把它变成一个自动化技能;如果你做某件事很困难,完成后也把它变成技能,这样下次就是免费的。一个内部没有可重用技能的循环,只是一个围绕陌生人的 while-true。一个调用一组精炼、经过测试、命名的技能的循环,则是一个能产生复利的系统。Reddit 上真正在实践的人说得最好:
“很多人在推特上翻白眼,但我竖起了耳朵。”
r/ChatGPTCoding,2026 年 6 月
所以,“WTF 是循环”的答案并不是关于提示工程死亡的激烈言论。而是:停止做循环里的那个东西。编写一次循环,赋予它值得调用的技能和可以自我检查的反馈,设置上限以便它停止,然后让它按 cron 运行,而你去决定接下来构建什么。Steinberger 和 Boris 是从两个角度描述同一个动物。真正知道它是什么的只有那些已经构建过一个的人。好消息是,从本月开始,入门只需要一个斜杠命令。
研究中的关键模式
- 循环是 cron 加上体内的决策者:模型,而不是硬编码的分支,在每个周期选择下一个动作。
- 发展脉络是真实的:2022 年的 ReAct,2023 年的 AutoGPT,2025 年的 ralph,2026 年春季的 /goal,现在的编排循环。单代理 ralph 是老套;多代理监督是新的一层。
- 循环的好坏取决于它的反馈。持续的审查和验证门控是使循环值得信赖的关键。
- 昂贵的资源从令牌转移到了循环管理。限制迭代次数、检测无进展、设定预算上限。
- 循环内部可重用的单元是技能,而不是提示。调用精炼、命名技能的循环会产生复利;重新推导所有内容的循环只是在烧钱。
所有代理均已回报
-
Reddit:17 个声音(r/ClaudeAI, r/AI_Agents, r/ExperiencedDevs),47 个帖子,34k 赞
-
X:21 个声音(steipete, bcherny, runes_leo),56 条帖子,175 次转发
-
YouTube:4 个声音(WorkOS, Lenny’s Podcast, Y Combinator),谈话记录
-
TikTok:6 个声音(ai.native.founder, nikpolale),34 个片段
-
Instagram:4 个声音(sequenzy_com, ai.builders),14 个 Reels
-
Hacker News:12 个声音,54 个故事,1k 条评论
-
GitHub:6 个仓库(gastownhall/gastown, NousResearch/hermes),steipete 259+ 个 PR
-
主要声音:steipete, bcherny, runes_leo, rohit_jsfreaky, MatthewBerman
基于 2026-06-07 的 /last30days 运行编译。方面:设计循环来提示编码代理、AI 循环、编码循环。
共同创立了一家自走式烤箱公司(被 Weber 收购)以及后来成为 Lyft 的公司。正在再次创业,很快会有更多消息。我在睡觉时运行循环来发布开源 PR,并且我在后台用 /last30days 研究来编写这些循环。
相似文章
@0xCodez: https://x.com/0xCodez/status/2064374643729773029
一个包含14个步骤的循环工程路线图,指导开发者从手动提示AI编码代理到设计自动化系统,由系统自行处理提示、验证和迭代。
@techwith_ram: https://x.com/techwith_ram/status/2064925285003542820
探讨了AI编程中从人类在环到自主代理循环的转变,其中代理自我提示并迭代,讨论了减少人类控制的前景与隐藏成本。
@cellinlab: https://x.com/cellinlab/status/2064144608242679822
这篇文章介绍了 Loop Engineering 的概念——不再直接给 AI agent 写 prompt,而是设计一个系统(loop)来递归地让 agent 迭代工作,直到任务完成。文章详细对比了 Claude Code 和 Codex 在 automations、worktrees、skills、sub-agents 等五个构建块上的实现,认为这可能是未来与 coding agent 协作的趋势,但仍需警惕 token 成本和 AI slop 问题。
@freeman1266: https://x.com/freeman1266/status/2064702757773496552
本文介绍Loop Engineering概念,即通过设计自动化系统让AI代理自主循环工作,包括自动化任务、工作树、技能、插件、子代理等要素,从而取代手动提示的方式,提升开发效率。
@akshay_pachaar:关于循环工程。这周大家都在说同一件事。你不再提示代理,而是设计循环来提示它们……
这篇文章讨论了AI代理的循环工程,并介绍了Opik——一个来自Comet ML的开源工具,用于生成式AI应用的调试、评估和优化,重点在于自动化失败处理以及根据真实失败构建回归测试。