@unicodef1wn: https://x.com/unicodef1wn/status/2070179071548395916
摘要
一篇推文解释了Anthropic在Claude Code中的动态工作流如何让Claude为复杂任务构建自定义框架,通过将工作拆分到不同的智能体来防止智能体惰性、自我偏好偏差和目标漂移等失败模式。内容包含供用户参考的实用示例和模式。
查看缓存全文
缓存时间: 2026/06/26 10:10
多个Claude,一个目标:动态工作流解析
大多数人使用AI的方式是最慢的:手动输入请求、等待、修正、再问一遍。这在小任务上还行,但一旦任务变大,一个窗口里的单个Claude就开始吃力,而你隐隐感到不对劲却不知为何。工作流就是解决方案。
Anthropic在Claude Code中推出了动态工作流。Claude现在能即时编写自己的工作框架,针对当前任务定制搭建。
默认的工作框架是为编程设计的,它能带你走很远,因为很多工作底层都像编程。但有些任务会突破这个框架:长时间运行的任务、大规模并行的任务、有严格评判标准的对抗性任务。工作流能让你跨越这条线。
这里有一个大多数人忽略的点:你不是在配置一个工具,而是在让Claude构建这个工具,然后运行它。
为什么单个窗口会崩
让默认框架处理大型任务,它会在同一个上下文窗口中规划和执行。在这个窗口中工作得越久,三种故障模式就会显现。
代理惰性。 Claude在取得部分进展后就宣告胜利,比如审查完50项中的20项就草草收场。
自我偏好偏差。 让Claude对照评判标准给自己的输出打分,它会偏袒自己的发现。
目标漂移。 在多次交互后,尤其是上下文被压缩后,目标变得模糊。每次总结都会丢失一些信息,你开头写的“不要做X”会悄悄消失。
工作流通过结构而非意志力来消除所有三种问题。它将任务拆分成多个独立的Claude,每个都有自己干净的窗口和一个狭窄的目标。调度者掌控计划,执行者负责工作,一个独立的检查者进行评分。
你不需要编码也能使用
人们首先会以为:这是开发者的玩具。其实不是。工作流就是Claude协调一组Claude,而需要团队协作的任务比比皆是。将以下任何一条粘贴到Claude Code中,它就会自己构建框架。
对一堆东西进行排序。
“这里有一个文件夹,里面有80份简历。使用工作流为后端岗位排序,然后复查前十名。先采访我,构建评判标准。”
一个代理在各自窗口中读取每份简历,一个锦标赛通过两两比较来排序,一个检查者重新阅读你的前十名,确保没有疏漏。你可以用同样的方式处理一千个支持工单。
对自己写的内容进行事实核查。
“浏览我的博客草稿,使用工作流对照代码库验证每一个技术性陈述。我不想发布任何错误内容。”
一个代理提取出所有事实性陈述,另一个独立的代理逐一检查,第三个评分判断来源是否可靠。做出陈述的作者无法直接放行。
挖掘无人问津的积压工作。
“查看Slack上过去六个月#incidents频道的内容,使用工作流找出反复出现的根本原因,但没有人提交工单的情况。”
这不仅限于工程师。将Slack换成你的销售数据(“为什么三月份收入下降了?”)或一个失败流程,同样的结构可以运行事后分析:独立的代理根据独立的证据形成理论,然后进行辩论。
命名及其他品味判断。
“为这个工具头脑风暴出30个名字,然后运行一个工作流锦标赛,按照评判标准选出前三名。”
命名、设计、文案,任何答案都依赖判断力的任务。Claude生成一个范围,审查代理根据“好“的定义进行评分,然后通过淘汰赛选出胜者。没有一个代理会沉迷于自己的点子。
把你的错误变成规则。
“使用工作流查看我过去的50次操作,找出我反复修正的地方,然后将反复出现的问题变成规则。”
它将修正内容聚类,将每个候选规则对照真实的历史错误进行检查,只保留那些能捕捉到问题的规则。幸存下来的规则会写进一个文件,Claude每次都会读取。
它由六种模式组合而成
在底层,Claude将每个工作流组合成一组有限的模块。学会这六种模式,你就能读懂任何它编写的工作流,并将其引导至你想要的形态。
-
分类并行动。 一个分类器判断任务类型,然后路由到正确的代理。
-
分发并综合。 拆分成许多小步骤,每个步骤运行一个代理,然后合并。合并等待所有步骤完成,因此各步骤不会交叉污染。
-
对抗性验证。 对于每个生成内容的代理,再生成一个第二个代理,其唯一任务就是根据评判标准对其进行攻击。这是工具箱中最有用的一招。
-
生成并过滤。 生成大量内容,删除重复项,只保留经过测试的幸存者。
-
锦标赛。 代理在同一任务上竞争,裁判两两比较直至决出胜者。比较优于评分。
-
循环直到完成。 当不知道工作量有多大时,持续运行直到满足某个条件:没有新发现、没有剩余错误。不是固定计数器。
让制造者远离检查者
以上所有都依赖于一个在单个窗口中无法实现的动作:将执行工作的代理与评判它的代理分开。
一个既编写修正方案又对其进行评分的Claude会通过自己的方案。这就是自我偏好偏差,没有任何提示能说服它放弃。工作流将输出交给一个没有利益关联的检查者。同样的技巧也用于调试:生成多个代理,从不同证据形成理论——一个看日志,一个看文件,一个看数据——然后将每个理论发送给一组验证者和反驳者。没有人会迷恋自己的答案。
何时跳过
工作流会消耗更多令牌。一个由五名审查者组成的小组对于普通的错误修复来说是大材小用。在使用之前,问问这个任务是否真的需要更多计算力。大多数不需要。将工作流留给那些单个窗口无法胜任的任务:迁移、千行排序、你不能发布出错的报告。
转变
静态工作流最初出现,通过SDK手动编写,足够通用以覆盖每种边缘情况。随着Opus 4.8的推出,Claude转为为你当前的具体任务编写自定义框架。配合使用 /goal 设置明确的终点线和 /loop 按计划运行。通过告诉它“使用10k令牌”来控制成本。在菜单中按 s 保存一个,然后将其嵌入技能中供团队复用。
旧的任务是编写提示。新任务是设计团队,然后让Claude构建运行该团队的框架。
把这篇书签收藏,方便以后使用这些提示。回复时告诉我你会让工作流处理的第一项任务。
如果你对赚钱及一切与AI相关的事情感兴趣
别忘了关注我 @unicodef1wn
相似文章
一篇详细描述Anthropic自身工程师使用Claude Code时的确切配置和工作流程的文章,包括并行实例、CLAUDE.md模式、写作者/审阅者分离、技能文件夹、插件、钩子和批量操作。
一篇详细介绍Anthropic工程师在使用Claude Code时的具体配置和工作流程的文章,涵盖并行实例、CLAUDE.md模式、写作者/审阅者分离、技能文件夹、插件、钩子和批量操作。
@RLanceMartin: https://x.com/RLanceMartin/status/2070571422913876182
这篇文章讨论了Anthropic的Claude Tag从单用户代理演变为Slack中的组织级工具的过程,通过改进的模型能力和安全性,实现了多玩家协作、异步工作和主动行为。
@0xMortyx: https://x.com/0xMortyx/status/2069002136873058485
一份关于使用 Claude Code 的 Dynamic Workflows 模式从单个主代理编排多个并行子代理的详细指南,包含覆盖任务分解、隔离和审查的 9 个步骤。
@trq212: https://x.com/trq212/status/2061907337154367865
Claude Code 发布了动态工作流功能,使得Claude能够为研究、安全分析、代理团队和代码审查等任务创建自定义框架,所有这些都在工具内原生实现。
Claude Code 在大型代码库中的工作原理
Anthropic 的博文详细介绍了在大型复杂代码库中使用 Claude Code 的最佳实践,阐述了代理搜索以及如 CLAUDE.md 文件等扩展的“利用”如何在大规模下提升导航和性能。