@Smartpigai: https://x.com/Smartpigai/status/2064209609896968679
摘要
本文探讨了在Agent时代,Loop Engineering(循环工程)比Prompt Engineering(提示工程)更重要的观点。作者认为,AI Agent的核心能力不在于模型本身,而在于围绕模型构建的反馈循环系统,这决定了Agent能否持续改进和接近正确答案。
查看缓存全文
缓存时间: 2026/06/10 09:48
Loop Engineering:Agent时代最被低估的能力
过去两年,Prompt Engineering 几乎成为 AI 时代最具代表性的概念之一。无数教程在教人如何写提示词,如何设计 System Prompt,如何利用 Few-shot、Chain of Thought、Role Playing 等技巧获得更好的结果。许多人甚至认为,掌握 Prompt Engineering 就等于掌握了 AI。
但如果你最近半年持续使用 Claude Code、Codex、Gemini CLI 或各种 Agent 产品,你可能已经开始意识到一件事:Prompt Engineering 正在变得越来越不重要。真正决定 Agent 能力上限的东西,其实是 Loop Engineering。
很多人对 Agent 的理解仍然停留在“大语言模型自动完成任务”这个层面。实际上,Agent 的核心从来都不是模型,而是循环。如果让 GPT、Claude 或 Gemini 完成一个复杂的软件项目,仅仅给它一个 Prompt,模型通常会在几分钟内输出一个看似合理但问题重重的结果。然而,当同一个模型被放进一个能够持续执行、验证、反馈和修正的循环系统之后,它的表现会发生质变。
原因在于,智能本身并不等于正确答案。智能只是生成候选答案的能力,而真正让系统不断接近正确答案的,是反馈循环。
想象一个程序员。如果他被要求开发一个网站,但整个过程中禁止运行代码、禁止查看日志、禁止测试、禁止用户反馈,那么无论他多么聪明,最终结果都很可能是一场灾难。复杂问题无法通过一次思考直接解决,只能通过不断试错逐渐逼近答案。软件开发如此,科学研究如此,创业如此,人类学习任何技能也如此。
事实上,人类文明本身就是建立在循环之上的。婴儿学习走路时,需要经历迈步、摔倒、调整、再次尝试的过程;科学研究需要经历提出假设、设计实验、观察结果、修正理论、重新实验的过程;甚至生物进化也是一个持续数十亿年的反馈循环——随机变异、环境筛选、生存竞争、再次变异。整个过程没有所谓的“超级 Prompt”,有的只是无数次反馈与迭代。
然而过去很长时间里,AI 行业对于循环的重要性关注并不充分。原因很简单,传统语言模型本质上是一次性函数。输入 Prompt,输出答案,然后结束。训练阶段可能经历了数万亿 Token 的优化,但在推理阶段,它只有一次机会。它无法验证自己的结果,无法观察环境变化,无法根据执行结果调整计划,更无法形成完整闭环。
因此我们才会看到各种熟悉的问题:一本正经地胡说八道、编造不存在的 API、生成无法运行的代码、捏造参考文献,以及给出逻辑完整却事实错误的答案。这些问题背后的根源其实是同一个——缺少反馈。
Agent 的出现改变了这一点。因为 Agent 第一次让模型拥有了行动能力。它不再只是预测下一个 Token,而是能够调用工具、运行代码、访问文件、读取网页、执行命令,并观察执行结果。更重要的是,它能够根据结果重新规划下一步行动。这意味着 AI 第一次真正拥有了构建反馈循环的能力。
如果观察当下最先进的 Coding Agent,你会发现它们实际上都在做同一件事:不是增强推理,而是增强循环。Claude Code 会持续读取终端输出和错误日志;Codex 会不断运行测试并根据结果修复代码;Cursor 会实时检查编译结果;OpenHands 会根据执行结果重新规划任务;Devin 则试图监控整个开发环境。这些系统最核心的部分都不是模型本身,而是围绕模型构建的反馈机制。
这也是为什么许多开发者会有类似体验:同一个模型,在聊天框里可能只能解决一个 60 分的问题;放进 Agent 框架之后,却能够完成 90 分的工作。模型没有变化,参数没有变化,训练数据没有变化,唯一变化的是循环。
从这个角度看,Prompt Engineering 与 Loop Engineering 实际上是在解决两个完全不同的问题。Prompt Engineering 关注的是如何更准确地表达需求,让模型从一开始就朝正确方向前进;而 Loop Engineering 关注的是当模型走错方向之后,如何快速发现问题、获得反馈、修正错误,并持续接近目标。
随着模型能力不断提升,Prompt Engineering 的价值很可能会逐渐商品化。未来的模型会自动理解意图、自动补全上下文、自动规划任务、自动调用工具,人们不再需要花费大量时间研究提示词技巧。Prompt 会越来越像自然语言交流,而不是一种特殊的编程语言。
但 Loop 不会消失,反而会变得越来越重要。因为当所有人都拥有相似的基础模型时,真正拉开差距的将不再是推理能力,而是反馈能力。未来两个拥有同等级模型的 Agent 系统,其能力差距可能完全来自于谁拥有更好的验证机制、更快的反馈速度、更准确的评估系统以及更高质量的奖励信号。
事实上,我们已经在强化学习领域见过类似现象。许多人认为 AlphaGo 的成功来自更强大的神经网络,但更关键的其实是反馈机制。通过自我对弈产生反馈,通过胜负结果形成奖励,再利用奖励驱动优化。系统在不断循环中获得越来越高质量的数据,并最终形成能力飞轮。AlphaGo 击败顶级棋手,不仅因为它会思考,更因为它拥有世界上最强大的学习循环之一。
Agent 时代正在经历同样的变化。未来最优秀的 Agent 公司未必拥有最强大的模型,但一定拥有最优秀的循环系统。他们会设计自动测试框架、自动验证框架、自动评估框架、自动反思框架和自动学习框架,让模型持续获得高质量反馈,并在反馈中不断成长。
因此,Loop Engineering 或许正在成为一个新的学科。如果说 Prompt Engineering 研究的是“如何告诉 AI 该做什么”,那么 Loop Engineering 研究的则是“如何让 AI 在做错之后不断变好”。前者关注输入,后者关注成长;前者决定起点,后者决定上限。
未来五年,最有价值的 AI 工程师可能不是最会写 Prompt 的人,而是最会设计 Loop 的人。他们关注的不再是如何让模型第一次就给出正确答案,而是如何构建反馈系统、定义成功标准、自动验证结果、建立奖励机制,并让 Agent 在失败中持续学习。
如果说 Prompt Engineering 是教 AI 如何开始工作,那么 Loop Engineering 则是在教 AI 如何持续进步。而历史已经无数次证明,真正强大的系统从来不是不会犯错的系统,而是能够持续发现错误、修正错误,并在循环中不断成长的系统。
这或许才是 Agent 时代最重要的秘密:决定未来的,不是更聪明的大脑,而是更优秀的循环。
相似文章
@cellinlab: https://x.com/cellinlab/status/2064144608242679822
这篇文章介绍了 Loop Engineering 的概念——不再直接给 AI agent 写 prompt,而是设计一个系统(loop)来递归地让 agent 迭代工作,直到任务完成。文章详细对比了 Claude Code 和 Codex 在 automations、worktrees、skills、sub-agents 等五个构建块上的实现,认为这可能是未来与 coding agent 协作的趋势,但仍需警惕 token 成本和 AI slop 问题。
@cellinlab: Loop Engineering 正在取代“你亲自给 agent 写 prompt”这件事。 它的核心是:你不再直接 prompt agent,而是设计一个系统,让这个系统去 prompt agent。
Loop Engineering 正在取代直接为 agent 写 prompt 的方式,核心是设计一个系统来为 agent 编写 prompt。
@knoYee_: https://x.com/knoYee_/status/2062780637677752366
作者复盘了使用多Agent协作三个月的经验,总结出五个主要痛点(如Agent间矛盾、忽略边界条件、自我审查失效、合并决策困难、压缩执行后暴露更难问题)和两个心得(只读审查Agent价值高、Agent矛盾暴露需求模糊),强调了人类在AI协作中的核心决策作用。
@freeman1266: https://x.com/freeman1266/status/2064702757773496552
本文介绍Loop Engineering概念,即通过设计自动化系统让AI代理自主循环工作,包括自动化任务、工作树、技能、插件、子代理等要素,从而取代手动提示的方式,提升开发效率。
本文系统梳理了AI Agent架构与工程实践,涵盖控制流、上下文工程、工具设计、记忆、多Agent组织、评测、追踪和安全,基于OpenClaw实现展开,强调Harness(测试验证基础设施)对系统稳定性的关键作用。
本文系统梳理了AI Agent架构与工程实践,涵盖控制流、上下文工程、工具设计、记忆、多Agent组织、评测、追踪和安全,基于OpenClaw实现展开,强调Harness(测试验证基础设施)对系统稳定性的关键作用。