@AndrewYNg: “循环工程”在Boris Cherny(Claude Code的创建者)和Peter Steinberg等人提及后成为热门流行语…

X AI KOLs Timeline 新闻

摘要

Andrew Ng讨论了“循环工程”的概念,将其作为构建AI智能体以迭代开发软件的关键方法,并概述了三个主要循环:智能体编码循环、开发者反馈循环和外部反馈循环。

“循环工程”在Boris Cherny(Claude Code的创建者)和Peter Steinberger(OpenClaw的创建者)于社交媒体上提及后,已成为一个热门流行语。循环现在是我们让AI智能体长时间迭代构建软件的关键部分。在这封信中,我想分享我在构建从0到1的产品时使用的三个关键循环,如下图所示。这些循环不仅指导我如何构建软件,也指导我决定构建什么软件。 智能体编码循环:给定产品规格和一组评估(即用于衡量性能的数据集),我们可以让AI智能体编写代码、测试其工作,并持续迭代,直到代码无错误且符合规格。这种闭环思想大约在去年年底开始流行,它已成为编码智能体无需人工干预即可长时间高效工作的游戏规则改变者。例如,上周末我在为女儿构建一个练习打字的应用,我的编码智能体可以轻松地工作大约一个小时,多次使用浏览器检查其构建结果,然后才返回给我,无需我干预。 工程循环执行速度很快。每隔几分钟,编码智能体可能会构建并测试一个新版本的软件。我经常听到开发人员正在寻找新的方法来设计更高效的工程循环。这是一个活跃的发明领域! 开发者反馈循环:在这个循环中,开发者检查当前产品并引导编码智能体进行改进。去年,很多开发者(包括我)都在充当编码智能体的QA(质量保证)角色,手动发现错误,然后要求智能体修复它们。但随着编码智能体能够更自主地测试自己的代码,我们花在这个功能上的时间显著减少。这使我们能够做出更高级的产品决策,例如提供哪些关键功能、UI需要改进的地方等。 开发者反馈循环的操作时间间隔在几十分钟到几小时之间——这是开发者查看产品并给出反馈的频率。以打字应用为例,我多次改变了视觉设计、她学习时可以解锁的猫咪服装(她喜欢猫),以及成年人登录并指导孩子学习体验的用户流程。 当开发者对构建什么有清晰的愿景时,将这一愿景转化为编码智能体可实施的规格仍然需要大量工作。此外,在开发者看到实施结果后,他们可能会更新(或澄清)规格以引导其朝期望方向发展。如果你发现系统反复遇到某些问题,那么为智能体构建一组评估就变得很有用。 越来越多的AI原生团队使用AI来帮助塑造产品方向,例如自动收集和分析使用数据、总结书面和口头的客户反馈,或进行竞争分析。然而,对于我参与的大多数产品,我认为人类相对于当前的AI系统具有显著的情境优势——我们对用户和产品必须运行的环境了解得比AI系统多得多——因此人类扮演着关键角色。许多人将这种人类贡献描述为“品味”,但我更倾向于将其视为人类的情境优势,因为这为我们提供了帮助AI系统变得更好的更清晰路径。这也解释了为什么这一步无法自动化:只要人类知道AI不知道的事情,就需要人类参与循环将知识注入系统。 外部反馈循环:这包括一系列策略,如向几个朋友征求意见、向alpha测试者发布、或通过A/B测试将代码投入生产。这些策略通常较慢,很少在几小时内完成,有时需要几天甚至几周。这些数据反馈到开发者的愿景,进而继续驱动详细的产品规格,再驱动编码智能体。 随着编码智能体加速软件开发,越来越多的工程师开始扮演部分产品管理的角色。对于许多正在成长进入这一角色的工程师来说,最困难的部分是塑造产品愿景,并在构建(弥合愿景与规格之间的差距)和获取用户反馈以演进愿景之间取得平衡。两者都很重要! 我将在未来的帖子中进一步讨论如何做到这一点,但就目前而言,我感到鼓舞的是工程师正在发挥更广泛的作用(正如产品经理和设计师现在更多地从事工程一样)。 [原文:《The Batch》]
查看原文
查看缓存全文

缓存时间: 2026/06/30 17:45

“循环工程”是近期在社交媒体上被 Boris Cherny(Claude Code 的创建者)和 Peter Steinberger(OpenClaw 的创建者)提及后迅速走红的热门词汇。循环现在已成为我们如何让 AI 代理反复迭代以构建软件的关键环节。在这封信中,我想分享我用于构建从零到一产品的三个关键循环,如下图所示。这些循环不仅指导我如何构建软件,也指导我决定构建什么样的软件。

编程代理循环:给定一个产品规格说明和(可选)一组评估(即一个用于衡量性能的数据集),我们可以让 AI 代理编写代码、测试其工作,并持续迭代,直到代码没有错误且满足规格要求。这种“闭环”的思想在去年年底开始流行,它改变了游戏规则,使编程代理能够在没有人工干预的情况下更长时间地高效工作。例如,上周末,我在为女儿构建一个练习打字的应用程序,我的编程代理可以轻松工作大约一个小时,多次使用网页浏览器检查它构建的内容,然后才回来找我,期间完全不需要我干预。

工程循环执行得很快。每隔几分钟,编程代理就可能构建并测试一个新版本的软件。我经常听到开发者们正在探索新的方法来设计更高效的工程循环。这是一个充满创造力的活跃领域!

开发者反馈循环:在这个循环中,开发者检查当前产品并引导编程代理进行改进。去年,很多开发者(包括我)都在充当编程代理的质量保证(QA)角色,手动查找错误,然后要求代理修复。但随着编程代理能够更好地自我测试代码,我们需要花费在这项功能上的时间已大幅减少。这让我们能够做出更偏向高层的产品决策,例如提供哪些关键功能、用户界面哪些地方需要改进等。

开发者反馈循环的运行时间间隔在十分钟到几小时之间——这就是开发者审查产品并提供反馈的频率。以打字应用为例,我在视觉设计、她学习过程中可以解锁哪些猫咪服装(她超爱猫咪),以及成人登录并引导孩子学习体验的用户流程等方面,都改变过几次主意。

当开发者对要构建的内容有清晰愿景时,将这一愿景转化为可供编程代理实现的规格说明仍然需要大量工作。此外,在看到实现结果后,开发者可能会更新(或澄清)规格,以引导其更接近自己想要的。如果发现系统反复遇到某些问题,那么为代理构建一套评估体系就会变得很有用。

原生 AI 团队越来越多地利用 AI 来帮助确定产品方向,例如自动收集和分析使用数据、总结书面和口头客户反馈,或进行竞争分析。然而,对于我所参与的大部分产品,我认为人类相对于当前的 AI 系统拥有显著的上下文优势——我们对用户以及产品必须运行的环境了解得比 AI 系统多得多——因此人类发挥着关键作用。许多人将这种人类贡献描述为“品味”,但我更倾向于将其视为人类拥有上下文优势,因为这为我们帮助 AI 系统变得更好提供了更清晰的路径。这也说明了为什么这一步无法被自动化:只要人类知道 AI 不知道的事情,就需要人在回路中来将这种知识注入系统。

外部反馈循环:这包括一系列广泛的策略,如向几位朋友征求反馈、向 alpha 测试者发布、或通过 A/B 测试将代码投入生产。这些策略通常速度较慢,很少能在几小时内完成,有时甚至需要几天或几周。这些数据为开发者的愿景提供信息,进而继续驱动详细的产品规格,再进而驱动编程代理。

随着编程代理加速了软件开发,越来越多的工程师开始扮演部分产品经理的角色。对于许多正在成长为该角色的工程师来说,最困难的部分是塑造产品愿景,以及在构建(弥合愿景与规格之间的差距)和获取用户反馈以改进愿景之间取得平衡。两者都很重要!

我将在未来的文章中进一步阐述如何做到这一点,但目前,我对于工程师正在扮演更广泛角色(就像产品经理和设计师现在也做更多工程工作一样)这一趋势感到鼓舞。

[原文:The Batch]

相似文章

循环工程:设计能自动提示的系统

Reddit r/ArtificialInteligence

文章介绍了'循环工程'作为AI工作的第四阶段,工程师设计系统自动提示、执行、评估和迭代而无需人工干预,超越了提示工程和自主工具使用。