@Saboo_Shubham_: 生成已被AI智能体解决。循环工程可以无限产出。剩下的只有验证和判断…
摘要
认为在AI时代,产品经理的关键技能是循环工程,而非提示工程。描述了如何为AI智能体创建可复用、自我改进的循环,以保持质量并避免漂移。
查看缓存全文
缓存时间: 2026/06/22 01:40
生成已由AI代理解决。循环工程可以无限产出。剩下的只有验证和判断。最近创建Claude Code的Boris说,他不再编写提示词了。他编写循环,循环替他完成提示。在2026年1月,我
产品经理的循环工程
下一个PM技能不是提示工程。而是循环工程。
过去两年里,大多数PM都在努力提升提示技巧。更好的指令、更好的上下文、更好的示例、更好的方式来告诉Claude、Codex、Cursor或他们使用的任何代理该做什么。
最终状态不是PM每次需要时都写出完美的提示词。而是PM设计出一个每次运行时都在改进的系统。
循环是AI系统反复经历的过程。你改变某个影响代理行为的东西。运行代理。评估输出。如果质量提升,保留更改;如果质量下降,撤销更改。然后将学到的经验提交,使下一版本比上一版本更进一步。
对工程师来说,这个循环始于代码。
对PM来说,它始于别处。始于塑造产品工作的工件:PRD审查技能、客户电话摘要器、评估标准、发布清单、研究工作流、CLAUDE.md指令、提示模板或优先级排序框架。
这些是持久的。它们被重复使用。它们编码了你的判断力。它们塑造代理在数十次运行中的行为,而非一次。
正因为被重复使用,它们会双向累积。好的工件让你的工作每周都更锐利。坏的工件让工作每周都更慢,悄无声息,直到你注意到输出感觉不对却说不出原因。
这就是为什么它们需要循环。一次性提示错了可以承受。但一个十个人依赖的评估标准不容有错。
提示无法解决的问题
第一个转变很明显。代理让构建变得更简单。
你描述一个仪表盘,就得到一个原型。你写一个粗略的想法,就得到可工作的代码。你交上十份客户对话记录,几分钟内得到结构化综合。
这改变了PM的工作流程。你不再只是写规格、交给工程、等待、审查、重复。你现在可以直接塑造第一版。
但这样工作一段时间后,你会遇到另一个问题。
你的AI工作空间开始漂移。
你的CLAUDE.md变长了。你的PRD审查技能变得更严格。你的研究工作流接入了过去项目的指令。你的发布清单膨胀到代理忽略了一半内容。你的评估标准变了,但你忘了何时或为何改变。
一个月后,代理感觉变差了。它写出更差的PRD。给出泛泛的研究摘要。它错过了以前能抓住的产品细微差异。
模型可能并没有变差。是你的工件漂移了,而且没有东西在监视它们。
这就是循环工程为PM解决的真正问题。不是让一个提示更好。而是确保塑造你产品工作的工件在改进,而不是在缓慢退化。
循环实际由什么构成
一个有用的循环包含五个部分:触发器、动作、证据、记忆和停止条件。
触发器说明循环何时开始。动作说明代理应该做什么。证据说明你如何知道输出更好了。记忆说明学习成果保存在哪里。停止条件说明循环何时应该结束。
最后一部分在递归循环中最为重要。
很多AI系统失败不是因为模型不好。而是因为循环没有干净的退出。代理不断生成。不断扩展范围。不断创造工作。或者它给出一个自信的摘要,却没有足够的证据。
一个好的PM循环应该允许说:没有有意义的变化、输入太薄弱、这件事被阻塞了、质量未达标、或者此事需要人类决策。
一个能说“停止“的循环是你可以让它持续运行的循环。一个不能的循环是你得一直照看的循环。
如果你想看到这样的循环实例,Matthew Berman的循环库收集了工程、研究和运营领域的真实循环。它们是为工程师构建的,但五个部分对PM工作是一样的。
这在实践中是什么样子
以客户研究为例。
简单版本是问代理:“总结这些通话。” 这一次有用,但它不会改进你下次总结通话的效果。
更好版本是一个客户电话摘要器,它了解你的团队关心什么:痛点、当前解决方式、紧迫性、反对意见、产品差距、准确引用和后续行动。
循环版本每周运行一次。它使用摘要器,将新通话与之前主题进行比较,标记哪些是重复的,哪些是新的,哪些证据不足。你审查输出。如果摘要遗漏了细微差别,你改进工件。下一次运行会更好。
PRD审查也是如此。
简单版本是问:“你能审查这个PRD吗?” 更好版本是一个PRD审查工件,它知道你的团队的质量标准。循环版本测试这个工件是否真的给出了更好的反馈。
它是否抓住了模糊的问题?它是否推动了你需要真实证据?它是否指出了缺失的指标?它是否避免了无用的吹毛求疵?它是否保留了产品意图?
当答案下滑时,你修复的是工件,而不是提示。
提示帮助你一次性完成任务。循环工程改进的是塑造任务每次执行方式的工件。
你的第一个循环:每周产品信号
我不会从试图决定产品策略的循环开始。
那太宽泛、太主观、太容易出错。我会从产品运营开始。那里有重复的工作。那里有证据。那里需要一致性。
一个好的第一个循环是每周产品信号循环。
每周五,循环读取客户通话、支持工单、销售笔记、实验更新、分析摘要、已发布变更和待处理升级。它生成一份产品信号备忘录。
备忘录不应该是泛泛的摘要。它应该区分重复信号和孤立噪音。
它应该包含客户的原话。它应该显示自上周以来有什么变化。它应该指出哪些证据薄弱。它应该识别哪些路线图假设变得更强、更弱或保持不变。
你审查它。如果备忘录遗漏了重要内容,你更新工件。如果代理过度强调了弱证据,你收紧评估标准。如果出现了新的产品问题,你将其添加到下周的视角中。
几周后,这变得有用。
几个月后,它成了你在任何路线图会议前必须检查的东西。
品味仍然重要,但现在需要证据
PM一直依赖品味。
一个优秀的PM能阅读一份PRD并感觉到问题何时模糊不清。他们能判断客户的引述何时被过度引申。他们能感知发布计划何时在假装依赖关系不存在。
这种判断仍然重要。循环工程并不会消除它。如果说有什么不同的话,它把判断推到了中心位置。
Shubham Saboo
@Saboo_Shubham_
6月20日
生成已由AI代理解决。
循环工程可以无限产出。
剩下的只有验证和判断。
最近创建Claude Code的Boris说,他不再编写提示词了。他编写循环,循环替他完成提示。
在2026年1月,我
显示更多
引用推文
Shubham Saboo
@Saboo_Shubham_
1月7日
文章
现代AI时代的产品经理
PM的工作曾经是翻译。
你与客户交谈,综合他们的问题,编写规格,然后交给工程师。
你是“人们需要什么”和“什么被构建”之间的桥梁…
161 39 7 15K
帖子的最后一行就是现在整个工作:定义什么是对的,并确定何时达到了目标。问题在于如何做到这一点而不靠猜测。
但当你将判断放入可重用的工件时,品味需要证据。
如果你改变了PRD审查工件,你怎么知道它变好了?如果你更新了研究摘要器,你怎么知道它捕捉了更多信号而不是更多噪音?如果你收紧了发布清单,你怎么知道它提高了准备度而不是增加了形式主义?
这就是评估成为PM工作的地方。
一个PM评估不需要是巨大的基准。它可以从已知示例开始。
拿三份强PRD和三份弱PRD。运行你的PRD审查工件。它是否抓住了真正的差距?它是否避免了吹毛求疵?它是否保留了产品意图?
拿五份你已经理解的客户通话。运行你的研究摘要器。它是否捕捉了实际痛点?它是否准确引述?它是否区分了强信号和一次性噪音?
拿两次过去的发布:一次顺利,一次混乱。运行你的发布准备循环。它是否能抓住实际出问题的地方?
这就是循环工程。你不是在问“代理听起来聪明吗?”而是在问“这个工件是否在已知产品判断上改进了?”
循环需要记忆层
一旦你开始评估工件,你就需要有一个地方存放学到的经验。否则工作就消失了。
你在聊天中更改了一个提示。你将新指令粘贴到文件中。你调整了一个评估标准。你添加了一个示例。你删除了一个约束。输出变了,但历史消失了。
几周后,没人知道代理为什么那样行为。
这时GitHub变得有用。不是因为PM需要成为工程师,而是因为PM需要为日益塑造他们工作的工件提供版本历史。
工件保存在那里。更改保存在那里。评估结果保存在那里。决策日志保存在那里。回滚路径保存在那里。
如果工件改进了,你想要那次提交。如果它变差了,你想要差异。如果评估标准变了,你想要知道原因。如果发布清单抓住了真正的阻塞,你想要将那个学习保留到下一次发布。
仓库成了产品记忆。
任何循环的骨架
你不需要让这件事变得复杂。
选择一个重复的产品任务。写下它何时开始、使用什么输入、哪个工件指导它、代理应该做什么、好的输出看起来什么样、学习成果保存在哪里、以及循环何时应该停止。
这足以开始。
关键是要保持循环足够小,以便你确实能判断它是否在改进。并且每个严肃的PM循环都应该说明人类仍然拥有什么。
循环可以总结客户证据。它不应该独自决定策略。循环可以审查PRD。它不应该变成产品负责人。循环可以标记有风险的发布。它不应该在没有上下文的情况下做出权衡。
构建循环,但保持PM的角色。
这会失败的地方
循环通常以简单的方式失败。
触发器模糊。输入混乱。工件太长。证据主观。学习成果无处存放。停止条件薄弱。
或者你过早赋予循环过多权力。
最后一点是陷阱。不要以能够改变策略、向客户发送消息、更新路线图或未经审查做出产品承诺的循环开始。
从那些告知你仍需做出的决策的循环开始。让它们赢得信任。然后慢慢增加自主权。
这可能是与代理在产品工作中共存的最健康方式。
工作变成什么
PM的工作曾经是翻译。客户痛点变成需求。业务目标变成路线图。工程约束变成权衡。
那份工作仍然存在。但上面多了一层。
你现在设计让产品判断可重复的系统。你构建工件、对其进行版本控制、评估它们,并在它们漂移时发现。代理执行任务。你负责运行它的东西是否持续改进。
最优秀的PM不会是拥有最长提示库的人。他们会是那些知道产品工作中哪些部分应该成为持久循环、哪些工件应该指导它们、以及哪些决策应该保留给人类的人。
这就是PM工作的未来。
不是更好的提示。是可重用的工件,经过版本控制和评估,在每次运行都变得更锐利的循环中运行。
相似文章
@Saboo_Shubham_: AI产品经理的循环工程设计周期。过去两年里,产品经理们一直在试图写出完美的提示词……
本文描述了AI产品经理的循环工程设计周期,强调构建可重用且随时间不断改进的系统,而非一次性提示词。
@akshay_pachaar: https://x.com/akshay_pachaar/status/2069118430582866051
本文解释了AI代理中的循环工程概念,强调核心循环很简单,但关键工作在于模型周围的“束具”,包括知道何时停止以及防止上下文腐败。
@akshay_pachaar:关于循环工程。这周大家都在说同一件事。你不再提示代理,而是设计循环来提示它们……
这篇文章讨论了AI代理的循环工程,并介绍了Opik——一个来自Comet ML的开源工具,用于生成式AI应用的调试、评估和优化,重点在于自动化失败处理以及根据真实失败构建回归测试。
@jasonzhou1993: https://x.com/jasonzhou1993/status/2067937943545897143
循环工程是一种系统设计实践,让AI代理自主决定工作内容、执行并迭代,通过构建跨领域复合的外循环来超越手动提示。文章解释了两层代理框架,以及如何在循环间共享工件以促进累积学习。
@Maxsteinbrenner:提示工程已被循环工程取代。它是什么?(60秒解释)过去两年我们…
解释了从提示工程到循环工程的转变,AI智能体被赋予目标,通过递归循环(研究、起草、评估、测试、改进)迭代,直到达到标准,包括开放、封闭和编排三种循环方法。