@unicodef1wn: https://x.com/unicodef1wn/status/2070179071548395916

X AI KOLs Timeline 2026/06/25 16:15 产品

claude-code dynamic-workflows ai-agents multi-agent automation workflow-tips

摘要

一篇推文解释了Anthropic在Claude Code中的动态工作流如何让Claude为复杂任务构建自定义框架，通过将工作拆分到不同的智能体来防止智能体惰性、自我偏好偏差和目标漂移等失败模式。内容包含供用户参考的实用示例和模式。

https://t.co/IIKruRaVUa

查看原文

查看缓存全文

缓存时间: 2026/06/26 10:10

多个Claude，一个目标：动态工作流解析

大多数人使用AI的方式是最慢的：手动输入请求、等待、修正、再问一遍。这在小任务上还行，但一旦任务变大，一个窗口里的单个Claude就开始吃力，而你隐隐感到不对劲却不知为何。工作流就是解决方案。

Anthropic在Claude Code中推出了动态工作流。Claude现在能即时编写自己的工作框架，针对当前任务定制搭建。

默认的工作框架是为编程设计的，它能带你走很远，因为很多工作底层都像编程。但有些任务会突破这个框架：长时间运行的任务、大规模并行的任务、有严格评判标准的对抗性任务。工作流能让你跨越这条线。

这里有一个大多数人忽略的点：你不是在配置一个工具，而是在让Claude构建这个工具，然后运行它。

为什么单个窗口会崩

让默认框架处理大型任务，它会在同一个上下文窗口中规划和执行。在这个窗口中工作得越久，三种故障模式就会显现。

代理惰性。 Claude在取得部分进展后就宣告胜利，比如审查完50项中的20项就草草收场。

自我偏好偏差。 让Claude对照评判标准给自己的输出打分，它会偏袒自己的发现。

目标漂移。 在多次交互后，尤其是上下文被压缩后，目标变得模糊。每次总结都会丢失一些信息，你开头写的“不要做X”会悄悄消失。

工作流通过结构而非意志力来消除所有三种问题。它将任务拆分成多个独立的Claude，每个都有自己干净的窗口和一个狭窄的目标。调度者掌控计划，执行者负责工作，一个独立的检查者进行评分。

你不需要编码也能使用

人们首先会以为：这是开发者的玩具。其实不是。工作流就是Claude协调一组Claude，而需要团队协作的任务比比皆是。将以下任何一条粘贴到Claude Code中，它就会自己构建框架。

对一堆东西进行排序。

“这里有一个文件夹，里面有80份简历。使用工作流为后端岗位排序，然后复查前十名。先采访我，构建评判标准。”

一个代理在各自窗口中读取每份简历，一个锦标赛通过两两比较来排序，一个检查者重新阅读你的前十名，确保没有疏漏。你可以用同样的方式处理一千个支持工单。

对自己写的内容进行事实核查。

“浏览我的博客草稿，使用工作流对照代码库验证每一个技术性陈述。我不想发布任何错误内容。”

一个代理提取出所有事实性陈述，另一个独立的代理逐一检查，第三个评分判断来源是否可靠。做出陈述的作者无法直接放行。

挖掘无人问津的积压工作。

“查看Slack上过去六个月#incidents频道的内容，使用工作流找出反复出现的根本原因，但没有人提交工单的情况。”

这不仅限于工程师。将Slack换成你的销售数据（“为什么三月份收入下降了？”）或一个失败流程，同样的结构可以运行事后分析：独立的代理根据独立的证据形成理论，然后进行辩论。

命名及其他品味判断。

“为这个工具头脑风暴出30个名字，然后运行一个工作流锦标赛，按照评判标准选出前三名。”

命名、设计、文案，任何答案都依赖判断力的任务。Claude生成一个范围，审查代理根据“好“的定义进行评分，然后通过淘汰赛选出胜者。没有一个代理会沉迷于自己的点子。

把你的错误变成规则。

“使用工作流查看我过去的50次操作，找出我反复修正的地方，然后将反复出现的问题变成规则。”

它将修正内容聚类，将每个候选规则对照真实的历史错误进行检查，只保留那些能捕捉到问题的规则。幸存下来的规则会写进一个文件，Claude每次都会读取。

它由六种模式组合而成

在底层，Claude将每个工作流组合成一组有限的模块。学会这六种模式，你就能读懂任何它编写的工作流，并将其引导至你想要的形态。

分类并行动。 一个分类器判断任务类型，然后路由到正确的代理。
分发并综合。 拆分成许多小步骤，每个步骤运行一个代理，然后合并。合并等待所有步骤完成，因此各步骤不会交叉污染。
对抗性验证。 对于每个生成内容的代理，再生成一个第二个代理，其唯一任务就是根据评判标准对其进行攻击。这是工具箱中最有用的一招。
生成并过滤。 生成大量内容，删除重复项，只保留经过测试的幸存者。
锦标赛。 代理在同一任务上竞争，裁判两两比较直至决出胜者。比较优于评分。
循环直到完成。 当不知道工作量有多大时，持续运行直到满足某个条件：没有新发现、没有剩余错误。不是固定计数器。

让制造者远离检查者

以上所有都依赖于一个在单个窗口中无法实现的动作：将执行工作的代理与评判它的代理分开。

一个既编写修正方案又对其进行评分的Claude会通过自己的方案。这就是自我偏好偏差，没有任何提示能说服它放弃。工作流将输出交给一个没有利益关联的检查者。同样的技巧也用于调试：生成多个代理，从不同证据形成理论——一个看日志，一个看文件，一个看数据——然后将每个理论发送给一组验证者和反驳者。没有人会迷恋自己的答案。

何时跳过

工作流会消耗更多令牌。一个由五名审查者组成的小组对于普通的错误修复来说是大材小用。在使用之前，问问这个任务是否真的需要更多计算力。大多数不需要。将工作流留给那些单个窗口无法胜任的任务：迁移、千行排序、你不能发布出错的报告。

转变

静态工作流最初出现，通过SDK手动编写，足够通用以覆盖每种边缘情况。随着Opus 4.8的推出，Claude转为为你当前的具体任务编写自定义框架。配合使用 /goal 设置明确的终点线和 /loop 按计划运行。通过告诉它“使用10k令牌”来控制成本。在菜单中按 s 保存一个，然后将其嵌入技能中供团队复用。

旧的任务是编写提示。新任务是设计团队，然后让Claude构建运行该团队的框架。

把这篇书签收藏，方便以后使用这些提示。回复时告诉我你会让工作流处理的第一项任务。

如果你对赚钱及一切与AI相关的事情感兴趣

别忘了关注我 @unicodef1wn

@unicodef1wn: https://x.com/unicodef1wn/status/2070179071548395916

多个Claude，一个目标：动态工作流解析

为什么单个窗口会崩

你不需要编码也能使用

它由六种模式组合而成

让制造者远离检查者

何时跳过

转变

如果你对赚钱及一切与AI相关的事情感兴趣

相似文章

一篇详细描述Anthropic自身工程师使用Claude Code时的确切配置和工作流程的文章，包括并行实例、CLAUDE.md模式、写作者/审阅者分离、技能文件夹、插件、钩子和批量操作。

@RLanceMartin: https://x.com/RLanceMartin/status/2070571422913876182

@0xMortyx: https://x.com/0xMortyx/status/2069002136873058485

@trq212: https://x.com/trq212/status/2061907337154367865

Claude Code 在大型代码库中的工作原理

提交意见反馈