@Saboo_Shubham_: 生成已被AI智能体解决。循环工程可以无限产出。剩下的只有验证和判断…

X AI KOLs Timeline 2026/06/21 16:17 新闻

loop-engineering product-management ai-agents prompt-engineering workflow-design agent-workflow evaluation

摘要

认为在AI时代，产品经理的关键技能是循环工程，而非提示工程。描述了如何为AI智能体创建可复用、自我改进的循环，以保持质量并避免漂移。

生成已被AI智能体解决。循环工程可以无限产出。剩下的只有验证和判断。最近创建Claude Code的Boris说，他不再写提示词了。他编写循环，循环为他完成提示。2026年1月，我

查看原文

查看缓存全文

缓存时间: 2026/06/22 01:40

生成已由AI代理解决。循环工程可以无限产出。剩下的只有验证和判断。最近创建Claude Code的Boris说，他不再编写提示词了。他编写循环，循环替他完成提示。在2026年1月，我

产品经理的循环工程

下一个PM技能不是提示工程。而是循环工程。

过去两年里，大多数PM都在努力提升提示技巧。更好的指令、更好的上下文、更好的示例、更好的方式来告诉Claude、Codex、Cursor或他们使用的任何代理该做什么。

最终状态不是PM每次需要时都写出完美的提示词。而是PM设计出一个每次运行时都在改进的系统。

循环是AI系统反复经历的过程。你改变某个影响代理行为的东西。运行代理。评估输出。如果质量提升，保留更改；如果质量下降，撤销更改。然后将学到的经验提交，使下一版本比上一版本更进一步。

对工程师来说，这个循环始于代码。

对PM来说，它始于别处。始于塑造产品工作的工件：PRD审查技能、客户电话摘要器、评估标准、发布清单、研究工作流、CLAUDE.md指令、提示模板或优先级排序框架。

这些是持久的。它们被重复使用。它们编码了你的判断力。它们塑造代理在数十次运行中的行为，而非一次。

正因为被重复使用，它们会双向累积。好的工件让你的工作每周都更锐利。坏的工件让工作每周都更慢，悄无声息，直到你注意到输出感觉不对却说不出原因。

这就是为什么它们需要循环。一次性提示错了可以承受。但一个十个人依赖的评估标准不容有错。

提示无法解决的问题

第一个转变很明显。代理让构建变得更简单。

你描述一个仪表盘，就得到一个原型。你写一个粗略的想法，就得到可工作的代码。你交上十份客户对话记录，几分钟内得到结构化综合。

这改变了PM的工作流程。你不再只是写规格、交给工程、等待、审查、重复。你现在可以直接塑造第一版。

但这样工作一段时间后，你会遇到另一个问题。

你的AI工作空间开始漂移。

你的CLAUDE.md变长了。你的PRD审查技能变得更严格。你的研究工作流接入了过去项目的指令。你的发布清单膨胀到代理忽略了一半内容。你的评估标准变了，但你忘了何时或为何改变。

一个月后，代理感觉变差了。它写出更差的PRD。给出泛泛的研究摘要。它错过了以前能抓住的产品细微差异。

模型可能并没有变差。是你的工件漂移了，而且没有东西在监视它们。

这就是循环工程为PM解决的真正问题。不是让一个提示更好。而是确保塑造你产品工作的工件在改进，而不是在缓慢退化。

循环实际由什么构成

一个有用的循环包含五个部分：触发器、动作、证据、记忆和停止条件。

触发器说明循环何时开始。动作说明代理应该做什么。证据说明你如何知道输出更好了。记忆说明学习成果保存在哪里。停止条件说明循环何时应该结束。

最后一部分在递归循环中最为重要。

很多AI系统失败不是因为模型不好。而是因为循环没有干净的退出。代理不断生成。不断扩展范围。不断创造工作。或者它给出一个自信的摘要，却没有足够的证据。

一个好的PM循环应该允许说：没有有意义的变化、输入太薄弱、这件事被阻塞了、质量未达标、或者此事需要人类决策。

一个能说“停止“的循环是你可以让它持续运行的循环。一个不能的循环是你得一直照看的循环。

如果你想看到这样的循环实例，Matthew Berman的循环库收集了工程、研究和运营领域的真实循环。它们是为工程师构建的，但五个部分对PM工作是一样的。

这在实践中是什么样子

以客户研究为例。

简单版本是问代理：“总结这些通话。” 这一次有用，但它不会改进你下次总结通话的效果。

更好版本是一个客户电话摘要器，它了解你的团队关心什么：痛点、当前解决方式、紧迫性、反对意见、产品差距、准确引用和后续行动。

循环版本每周运行一次。它使用摘要器，将新通话与之前主题进行比较，标记哪些是重复的，哪些是新的，哪些证据不足。你审查输出。如果摘要遗漏了细微差别，你改进工件。下一次运行会更好。

PRD审查也是如此。

简单版本是问：“你能审查这个PRD吗？” 更好版本是一个PRD审查工件，它知道你的团队的质量标准。循环版本测试这个工件是否真的给出了更好的反馈。

它是否抓住了模糊的问题？它是否推动了你需要真实证据？它是否指出了缺失的指标？它是否避免了无用的吹毛求疵？它是否保留了产品意图？

当答案下滑时，你修复的是工件，而不是提示。

提示帮助你一次性完成任务。循环工程改进的是塑造任务每次执行方式的工件。

你的第一个循环：每周产品信号

我不会从试图决定产品策略的循环开始。

那太宽泛、太主观、太容易出错。我会从产品运营开始。那里有重复的工作。那里有证据。那里需要一致性。

一个好的第一个循环是每周产品信号循环。

每周五，循环读取客户通话、支持工单、销售笔记、实验更新、分析摘要、已发布变更和待处理升级。它生成一份产品信号备忘录。

备忘录不应该是泛泛的摘要。它应该区分重复信号和孤立噪音。

它应该包含客户的原话。它应该显示自上周以来有什么变化。它应该指出哪些证据薄弱。它应该识别哪些路线图假设变得更强、更弱或保持不变。

你审查它。如果备忘录遗漏了重要内容，你更新工件。如果代理过度强调了弱证据，你收紧评估标准。如果出现了新的产品问题，你将其添加到下周的视角中。

几周后，这变得有用。

几个月后，它成了你在任何路线图会议前必须检查的东西。

品味仍然重要，但现在需要证据

PM一直依赖品味。

一个优秀的PM能阅读一份PRD并感觉到问题何时模糊不清。他们能判断客户的引述何时被过度引申。他们能感知发布计划何时在假装依赖关系不存在。

这种判断仍然重要。循环工程并不会消除它。如果说有什么不同的话，它把判断推到了中心位置。

Shubham Saboo
@Saboo_Shubham_
6月20日
生成已由AI代理解决。
循环工程可以无限产出。
剩下的只有验证和判断。

最近创建Claude Code的Boris说，他不再编写提示词了。他编写循环，循环替他完成提示。
在2026年1月，我
显示更多
引用推文
Shubham Saboo
@Saboo_Shubham_
1月7日
文章
现代AI时代的产品经理
PM的工作曾经是翻译。
你与客户交谈，综合他们的问题，编写规格，然后交给工程师。
你是“人们需要什么”和“什么被构建”之间的桥梁…
161 39 7 15K

帖子的最后一行就是现在整个工作：定义什么是对的，并确定何时达到了目标。问题在于如何做到这一点而不靠猜测。

但当你将判断放入可重用的工件时，品味需要证据。

如果你改变了PRD审查工件，你怎么知道它变好了？如果你更新了研究摘要器，你怎么知道它捕捉了更多信号而不是更多噪音？如果你收紧了发布清单，你怎么知道它提高了准备度而不是增加了形式主义？

这就是评估成为PM工作的地方。

一个PM评估不需要是巨大的基准。它可以从已知示例开始。

拿三份强PRD和三份弱PRD。运行你的PRD审查工件。它是否抓住了真正的差距？它是否避免了吹毛求疵？它是否保留了产品意图？

拿五份你已经理解的客户通话。运行你的研究摘要器。它是否捕捉了实际痛点？它是否准确引述？它是否区分了强信号和一次性噪音？

拿两次过去的发布：一次顺利，一次混乱。运行你的发布准备循环。它是否能抓住实际出问题的地方？

这就是循环工程。你不是在问“代理听起来聪明吗？”而是在问“这个工件是否在已知产品判断上改进了？”

循环需要记忆层

一旦你开始评估工件，你就需要有一个地方存放学到的经验。否则工作就消失了。

你在聊天中更改了一个提示。你将新指令粘贴到文件中。你调整了一个评估标准。你添加了一个示例。你删除了一个约束。输出变了，但历史消失了。

几周后，没人知道代理为什么那样行为。

这时GitHub变得有用。不是因为PM需要成为工程师，而是因为PM需要为日益塑造他们工作的工件提供版本历史。

工件保存在那里。更改保存在那里。评估结果保存在那里。决策日志保存在那里。回滚路径保存在那里。

如果工件改进了，你想要那次提交。如果它变差了，你想要差异。如果评估标准变了，你想要知道原因。如果发布清单抓住了真正的阻塞，你想要将那个学习保留到下一次发布。

仓库成了产品记忆。

任何循环的骨架

你不需要让这件事变得复杂。

选择一个重复的产品任务。写下它何时开始、使用什么输入、哪个工件指导它、代理应该做什么、好的输出看起来什么样、学习成果保存在哪里、以及循环何时应该停止。

这足以开始。

关键是要保持循环足够小，以便你确实能判断它是否在改进。并且每个严肃的PM循环都应该说明人类仍然拥有什么。

循环可以总结客户证据。它不应该独自决定策略。循环可以审查PRD。它不应该变成产品负责人。循环可以标记有风险的发布。它不应该在没有上下文的情况下做出权衡。

构建循环，但保持PM的角色。

这会失败的地方

循环通常以简单的方式失败。

触发器模糊。输入混乱。工件太长。证据主观。学习成果无处存放。停止条件薄弱。

或者你过早赋予循环过多权力。

最后一点是陷阱。不要以能够改变策略、向客户发送消息、更新路线图或未经审查做出产品承诺的循环开始。

从那些告知你仍需做出的决策的循环开始。让它们赢得信任。然后慢慢增加自主权。

这可能是与代理在产品工作中共存的最健康方式。

工作变成什么

PM的工作曾经是翻译。客户痛点变成需求。业务目标变成路线图。工程约束变成权衡。

那份工作仍然存在。但上面多了一层。

你现在设计让产品判断可重复的系统。你构建工件、对其进行版本控制、评估它们，并在它们漂移时发现。代理执行任务。你负责运行它的东西是否持续改进。

最优秀的PM不会是拥有最长提示库的人。他们会是那些知道产品工作中哪些部分应该成为持久循环、哪些工件应该指导它们、以及哪些决策应该保留给人类的人。

这就是PM工作的未来。

不是更好的提示。是可重用的工件，经过版本控制和评估，在每次运行都变得更锐利的循环中运行。

相似文章

@Saboo_Shubham_: AI产品经理的循环工程设计周期。过去两年里，产品经理们一直在试图写出完美的提示词……

X AI KOLs Following

本文描述了AI产品经理的循环工程设计周期，强调构建可重用且随时间不断改进的系统，而非一次性提示词。

@akshay_pachaar: https://x.com/akshay_pachaar/status/2069118430582866051

X AI KOLs Following

本文解释了AI代理中的循环工程概念，强调核心循环很简单，但关键工作在于模型周围的“束具”，包括知道何时停止以及防止上下文腐败。

@akshay_pachaar：关于循环工程。这周大家都在说同一件事。你不再提示代理，而是设计循环来提示它们……

X AI KOLs Following

这篇文章讨论了AI代理的循环工程，并介绍了Opik——一个来自Comet ML的开源工具，用于生成式AI应用的调试、评估和优化，重点在于自动化失败处理以及根据真实失败构建回归测试。

@jasonzhou1993: https://x.com/jasonzhou1993/status/2067937943545897143

X AI KOLs Timeline

循环工程是一种系统设计实践，让AI代理自主决定工作内容、执行并迭代，通过构建跨领域复合的外循环来超越手动提示。文章解释了两层代理框架，以及如何在循环间共享工件以促进累积学习。

@Maxsteinbrenner：提示工程已被循环工程取代。它是什么？（60秒解释）过去两年我们…

X AI KOLs Timeline

解释了从提示工程到循环工程的转变，AI智能体被赋予目标，通过递归循环（研究、起草、评估、测试、改进）迭代，直到达到标准，包括开放、封闭和编排三种循环方法。

产品经理的循环工程

提示无法解决的问题

循环实际由什么构成

这在实践中是什么样子

你的第一个循环：每周产品信号

品味仍然重要，但现在需要证据

循环需要记忆层

任何循环的骨架

这会失败的地方

工作变成什么

相似文章

@Saboo_Shubham_: AI产品经理的循环工程设计周期。过去两年里，产品经理们一直在试图写出完美的提示词……

@akshay_pachaar: https://x.com/akshay_pachaar/status/2069118430582866051

@akshay_pachaar：关于循环工程。这周大家都在说同一件事。你不再提示代理，而是设计循环来提示它们……

@jasonzhou1993: https://x.com/jasonzhou1993/status/2067937943545897143

@Maxsteinbrenner：提示工程已被循环工程取代。它是什么？（60秒解释）过去两年我们…

提交意见反馈