@mvanhorn: https://x.com/mvanhorn/status/2063865685558903149

X AI KOLs Following 2026/06/08 06:08 新闻

ai-coding loops prompt-engineering claude-code orchestration developer-tools automation

摘要

本文解释了AI编程中'循环'的概念，即开发者编写程序来提示编码代理，而不是手动提示，这一概念由Peter Steinberger和Boris Cherny推广开来，并讨论了这种转变如何代表了AI辅助开发中的新抽象层。

https://t.co/DM0CAuyprS

查看原文

查看缓存全文

缓存时间: 2026/06/08 13:20

WTF 是循环？Peter Steinberger 对阵 Boris Cherny

本周 AI 编程领域被反复提及的一句话只有六个词，但几乎每个说这句话的人都无法定义它。一条推文本周让整个时间线陷入狂热，所以我用 /last30days 搜索了大家争论不休的那个词。答案是真实的，它已有五年的发展脉络，而关键点是：现在昂贵的不是模型，而是循环。

让时间线沦陷的那条推文

一条推文让整个 AI 编程时间线本周都为之着迷。Peter Steinberger 在 6 月 7 日发布了它，浏览量超过 220 万，评论栏里则演变成了一场关于它实际含义的争吵。

“这是你每月的提醒：你不应该再提示编码代理了。你应该设计循环来提示你的代理。”

@steipete，2026 年 6 月 7 日

这就是每个人都在引用的那句话。最意味深长的回复来自 Varadh Jain，他问出了唯一重要的问题：这在实践中是什么样子？而成为整个氛围的答案是 Matthew Berman 的。

“除了他和 Boris，没人知道。”

@MatthewBerman，2026 年 6 月 7 日

这才是真实的故事。不是循环是未来，而是一个六个词的说法达到了两百万的浏览量，同时推广它的人却在评论里争论它到底是什么意思。我没有翻白眼，因为我每天晚上都在运行一个循环，在我睡觉时跨大约三十个开源仓库打开拉取请求。短短九十秒的调查就找回了十五个 Reddit 帖子、二十一个 X 推文和一个令人不安的模式：AI 编程中最响亮的概念，大多数重复它的人却无法解释。一派人大喊提示工程已死。另一派人，那些真正把手放在键盘上的人，则更为谨慎。

“这不是 ralph/goal 循环，那现在已经过时了。可能是某种持续编排循环，负责监督其他线程/代理。”

@trashpandaemoji，2026 年 6 月 7 日

这条回复是所有人发布的最接近正确答案的内容。记好它。

循环到底是什么

Boris Cherny 在 2024 年 9 月将 Claude Code 作为副项目创建。据报道，它目前为 GitHub 上近 4% 的公共提交提供支持。在 6 月 2 日由 WorkOS 主办的 Acquired Unplugged 活动上，他给出了你能找到的最清晰的循环定义。

“现在我认为它又升级了，到了下一波抽象，我不再提示 Claude 了。我有循环在运行。它们是那些提示 Claude 并决定做什么的东西。我的工作是写循环。”

Boris Cherny，WorkOS Acquired Unplugged，2026 年 6 月 2 日

所以，这里是平实的版本。循环是一个你编写的小程序，它为你提示编码代理，读取它生成的内容，判断是否完成，如果没有完成，就再次提示它。你不再是循环内部输入提示的那个人。你变成了循环的作者。模型变成了一个子程序。

Boris 将其分为三个阶段，你最能理解的方式就是看自己处于他的梯子的哪一级。一年前，他靠自动补全手动写代码。然后他并行运行五到十个 Claude 会话，并逐个提示每个会话。现在他根本不提示了。他编写循环来提示 Claude，而几百个代理读取他的 GitHub、Slack 和 Twitter，然后决定接下来要构建什么。他有证据。

“在过去 30 天里，我对 Claude Code 的 100% 贡献都是由 Claude Code 编写的。我完成了 259 个拉取请求。”

Boris Cherny，通过 Simon Willison，2025 年 12 月 27 日

他在 11 月删除了他的 IDE，并且从那以后再也没有打开过。提示工程已死那帮人忽略的细微差别在于：他并不是说工程师已经过时了。仍然需要有人决定构建什么、与客户交谈并协调团队，他说优秀的工程师比以往任何时候都更重要。工作并没有消失，只是在更高的抽象层次上移动了一级：从编写代码变成了编写编写代码的东西。

光谱：从 ReAct 到编排

评论之所以混乱，是因为“循环”一词至少隐藏了五种不同的东西。以下是从最旧到最新的梯子，这样你们就不会再互相误解了。

第一阶段是学术意义上的 while 循环。2022 年的 ReAct 论文将其形式化：模型推理、调用工具、读取结果、重复直到完成。一个模型，一个循环，一个人类在监控。第二阶段是 2023 年的 AutoGPT，它给循环一个目标并让它自我提示，结果却因永远空转而不做任何事而闻名。那次失败奠定了“代理只是个玩具”这种说法的基础。

第三阶段是 Trash Panda 称为“老套”的那一种：ralph 循环，由 Geoffrey Huntley 在 2025 年 7 月发布。它简单得近乎荒唐，是一个 bash 单行命令，反复将同一个提示文件输入给代理。它真正的创新在于纪律：每次迭代都将上下文重置为一组固定的锚定文件，而不是让对话无限增长。Huntley 用它构建了一整门编程语言，只花了大约 297 美元。第四阶段将其产品化：2026 年春天，Codex 和 Claude Code 都推出了 /goal 命令，运行 ralph 循环，直到一个小型的验证器模型确认任务完成。

第五阶段才是 Boris 和 Steinberger 真正所指的，它确实是全新的，而不仅仅是改名而已。有四件事发生了变化。循环成为工作单位，而不是任务。循环开始同时并按计划监督其他循环。调度取代了人类的启动，因此循环在基础设施时间上运行，而不是依赖你的注意力。持久性变成了显式特性，带有 Git 支持的状态和崩溃恢复，因为这些循环必须能在重启后幸存。ralph 假设你的终端始终开着。2026 年的版本则假定它不会一直开着。所以 Trash Panda 两次说对了：单代理的 ralph 循环是老套，而在此基础上构建的多代理编排循环才是新事物。

它只是戴了顶帽子的 cron 作业

整个语料库中最好的怀疑论者观点只有四个词，发布在有人吹嘘循环是未来方向的帖子下面。

“Cron 作业现在正经历有趣的重新命名。”

X 回复，循环讨论，2026 年 6 月

这值得一个直接的回答，而不是回避，因为它说对了一半。是的，调度层就是 cron。Boris 实际上就是在 cron 上运行他的循环。Claude Code 中的 /loop 命令在底层也使用了 cron。如果你对循环的全部定义就是一个按定时器运行的东西，那么没错，我们早在 1975 年就发明了它，你可以回家了。

Cron 从未拥有的是中间的部分。一个 cron 作业运行一个固定的脚本。一个循环则运行一个模型，该模型查看当前状态，决定下一步做什么，执行它，检查是否成功，然后决定是否继续。决策是由代理做出的，而不是你，也不是硬编码的分支。将这些堆叠起来，让一个循环调度并监督其他循环，赋予它们持久化的共享状态，你就拥有了 cron 无法表达的东西。诚实的框架既不是循环是新魔法，也不是循环只是 cron。而是：循环是 cron 加上体内的决策者，而有趣的工程在于围绕那个决策所构建的一切，以防止它跑偏。

当你真正构建一个循环时它是什么样子

理论够了。入门路径只有一行。Claude Code 发布了 /loop，而 Boris 自己的例子就是标准的起点。复制这段并更改名词。

/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.

这是他更完整的配方。几天后，Boris 发布了五个自主运行 Opus 数小时或数天的技巧。

五个技巧，用他自己的话说：使用自动模式处理权限，这样 Claude 就不需要请求批准；使用动态工作流让 Claude 编排成百上千个代理来完成一个任务；使用 /goal 或 /loop 来推动 Claude 继续工作直到完成；在云端使用 Claude Code，这样你就可以合上笔记本电脑；并确保 Claude 有一种方法可以端到端地自我验证其工作。

@bcherny，2026 年 6 月

第五条是炒作忽略而实践者痴迷的那一条：循环的可靠性完全取决于它检查自己工作的能力。

这就是整个想法的微缩版。你没有编写步骤。你编写的是意图和停止行为，然后循环每个周期提示代理。在 TikTok 上，这个框架对普通观众来说很清晰。

“循环模式是 AI 编程正在从一次性提示转向后台操作的最明确迹象之一。”

@ai.native.founder 在 TikTok 上，2026 年 6 月

最深入的一端是 Steve Yegge 的 Gas Town，1 月发布：由二十到三十个 Claude Code 实例组成，由一个 Mayor 代理协调，加上运行持续循环的巡逻代理，状态存储在 Git 中，这样工作可以在崩溃后幸存。这就是 Trash Panda 试图表达的“监督其他线程的持续编排循环”，已经发布并开源。

但研究中给出的最实用的教训是：循环的好坏完全取决于它自我检查的能力。增长最快的子主题不是编排，而是验证。

“你的编码代理可以快速行动，但糟糕的提交也会快速累积。”

@DanKornas，2026 年 6 月

Kornas 正在推出 roborev，一个在后台审查每个提交的工具，并在上下文仍然新鲜时将审查结果反馈给代理。一个编写代码却没有反馈的开放循环，就是一个生成自信错误的机器。一个编写、运行、读取结果并修正的循环，才是真正有效的东西。魔法不在于循环本身，而在于循环内部的反馈。

情节转折：循环现在变成了昂贵的部分

这里研究从哲学问题变成了财务问题。整个代理神话最犀利的戳破来自一位工作工程师。

“我今年发布的每个 AI 代理都是一个 for 循环、一次 LLM 调用和一个围绕 JSON 解析的 try/catch。唯一具有‘代理性’的是月底来自 Anthropic 的账单。”

@rohit_jsfreaky，2026 年 6 月

那个账单可不是开玩笑。本月的账单证据：Uber 将工程师使用 Claude Code 和 Cursor 的每月每人每工具支出上限设为 1500 美元，因为其年度 AI 预算在四个月内就烧光了。一旦模型几乎免费地编写代码，成本就转移到了运行它的循环上。

“AI 编码中最昂贵的部分不再是编写代码，而是管理代理循环。”

@runes_leo，2026 年 6 月

而每个在生产环境中的人都害怕的失败模式是永不停止的循环。

“没有护栏，你就会得到无限循环和超出预算几个数量级的账单惊喜。”

@cv_usk，2026 年 6 月

这就是为什么每一个严肃的 2026 年关于循环的文章最终都会归结到相同的三个硬性停止条件：最大迭代次数、无进展检测以及令牌或美元预算上限。浪漫版本的循环是：你编写循环，一千个代理一夜之间为你打造公司。生产版本的循环是：你编写循环，而你的大部分工作是确保它们停下来。Gartner 将代理式 AI 置于期望膨胀的顶峰，实际上只有约 17% 的组织真正部署了代理。时间线投入和实际账单之间的差距，才是真实的状态。

不是循环，而是技能

这是我个人的看法，也是我在观察了一周后最终得出的结论。循环是管道。真正有价值的资产是它调用的技能。

Steinberger 另一个反复出现的观点与循环观点相辅相成，而且更为持久：如果你做某件事超过一次，就把它变成一个自动化技能；如果你做某件事很困难，完成后也把它变成技能，这样下次就是免费的。一个内部没有可重用技能的循环，只是一个围绕陌生人的 while-true。一个调用一组精炼、经过测试、命名的技能的循环，则是一个能产生复利的系统。Reddit 上真正在实践的人说得最好：

“很多人在推特上翻白眼，但我竖起了耳朵。”

r/ChatGPTCoding，2026 年 6 月

所以，“WTF 是循环”的答案并不是关于提示工程死亡的激烈言论。而是：停止做循环里的那个东西。编写一次循环，赋予它值得调用的技能和可以自我检查的反馈，设置上限以便它停止，然后让它按 cron 运行，而你去决定接下来构建什么。Steinberger 和 Boris 是从两个角度描述同一个动物。真正知道它是什么的只有那些已经构建过一个的人。好消息是，从本月开始，入门只需要一个斜杠命令。

研究中的关键模式

循环是 cron 加上体内的决策者：模型，而不是硬编码的分支，在每个周期选择下一个动作。
发展脉络是真实的：2022 年的 ReAct，2023 年的 AutoGPT，2025 年的 ralph，2026 年春季的 /goal，现在的编排循环。单代理 ralph 是老套；多代理监督是新的一层。
循环的好坏取决于它的反馈。持续的审查和验证门控是使循环值得信赖的关键。
昂贵的资源从令牌转移到了循环管理。限制迭代次数、检测无进展、设定预算上限。
循环内部可重用的单元是技能，而不是提示。调用精炼、命名技能的循环会产生复利；重新推导所有内容的循环只是在烧钱。

所有代理均已回报

Reddit：17 个声音（r/ClaudeAI, r/AI_Agents, r/ExperiencedDevs），47 个帖子，34k 赞
X：21 个声音（steipete, bcherny, runes_leo），56 条帖子，175 次转发
YouTube：4 个声音（WorkOS, Lenny’s Podcast, Y Combinator），谈话记录
TikTok：6 个声音（ai.native.founder, nikpolale），34 个片段
Instagram：4 个声音（sequenzy_com, ai.builders），14 个 Reels
Hacker News：12 个声音，54 个故事，1k 条评论
GitHub：6 个仓库（gastownhall/gastown, NousResearch/hermes），steipete 259+ 个 PR
主要声音：steipete, bcherny, runes_leo, rohit_jsfreaky, MatthewBerman

基于 2026-06-07 的 /last30days 运行编译。方面：设计循环来提示编码代理、AI 循环、编码循环。

共同创立了一家自走式烤箱公司（被 Weber 收购）以及后来成为 Lyft 的公司。正在再次创业，很快会有更多消息。我在睡觉时运行循环来发布开源 PR，并且我在后台用 /last30days 研究来编写这些循环。

@mvanhorn: https://x.com/mvanhorn/status/2063865685558903149

WTF 是循环？Peter Steinberger 对阵 Boris Cherny

让时间线沦陷的那条推文

循环到底是什么

光谱：从 ReAct 到编排

它只是戴了顶帽子的 cron 作业

当你真正构建一个循环时它是什么样子

情节转折：循环现在变成了昂贵的部分

不是循环，而是技能

研究中的关键模式

所有代理均已回报

相似文章

@0xCodez: https://x.com/0xCodez/status/2064374643729773029

@techwith_ram: https://x.com/techwith_ram/status/2064925285003542820

@omarsar0: https://x.com/omarsar0/status/2068008743153832264

AI世界正在变得‘循环’

@jasonzhou1993: https://x.com/jasonzhou1993/status/2067937943545897143

提交意见反馈