@0xDepressionn: https://x.com/0xDepressionn/status/2062185806999994444

X AI KOLs Timeline 2026/06/03 14:53 新闻

cost-optimization workflow claude-opus kimi-k2 agent-swarm dynamic-workflows prompts

摘要

一个团队通过使用Claude Opus 4.8进行编排、Kimi K2.6 Agent Swarm执行任务，配合一个包含15个提示词的详细系统，将AI工作流成本从每月62,000美元大幅削减至7,800美元。

https://t.co/DGep0M16LP

查看原文

查看缓存全文

缓存时间: 2026/06/04 03:59

15个提示词，把我的编码账单从7800美元砍到129美元

一个运行AI工作流的团队，单是Claude Opus每月就要花费62,000美元。

他们并没有做错什么。Opus 4.8非常出色。它能推理复杂问题、处理歧义、产出经得起推敲的结果。他们用Opus做所有事情：研究、起草、分析、总结、批量处理。

然后他们发现，Claude Opus 4.8的新版“动态工作流“功能是为特定场景设计的：跨数百个并行子代理编排复杂任务。

不是执行这些任务，而是编排它们。

他们把执行层迁移到了Kimi K2.6 Agent Swarm。同样的输出质量，同样的规模。每月7,800美元。

差额是每月54,200美元。每年650,400美元。

以下是这个系统的具体方案。

动态工作流

大多数团队忽略的配置

Claude Opus 4.8和Kimi K2.6并非竞争工具。它们不可互换。

Opus 4.8是战略家。它规划、推理、做出判断、综合复杂信息，并在长任务中维持质量标准。Anthropic设计动态工作流的目的是让Opus能够管理数百个并行子代理而不失去连贯性。

Kimi K2.6是执行者。它并行运行300个专业子代理，协调4000个步骤，处理大批量任务，并生成真实文件。它在SWE-Bench Pro上获得58.6%的分数。每百万token成本0.60美元。

昂贵的错误：将一切路由到Opus 4.8，而Opus的设计目的是指挥而不是执行。

正确的配置：Opus 4.8作为大脑，Kimi K2.6 Agent Swarm作为双手。

三个部分。十五个提示词。每月节省54,000美元的工作流。

1/3 | 编排：Opus 4.8的真正用途

Claude Opus 4.8附带三个大多数团队尚未触碰的功能。

动态工作流：Opus跨数百个并行子代理管理复杂任务执行。它路由工作、跟踪依赖、标记障碍，并在输出不符合预期时调整计划。

努力控制：Opus 4.8决定每个任务应花费多少计算资源。对于简单的路由决策，它使用最低努力；对于可能级联影响300个下游代理的质量判断，它使用最大推理。同一会话内，自动进行。

扩展独立性：Opus 4.8无需频繁检查即可长时间工作。它主动标记不确定性。一个13小时的自主工作流不再需要你盯着前两个小时。

这些都不需要Opus执行实际工作。它需要Opus清晰地思考应该发生什么，并确保事情按计划进行。

五个提示词。Opus 4.8作为编排层运行。

工作流编排图

→ 提示词1：Opus 4.8作为项目规划器：

我需要使用多个AI代理执行以下项目：

项目：[描述你需要的完整成果] 规模：[数量/文件/任务] 质量标准：[好的输出是什么样的] 约束：[截止日期、格式、限制]

你的任务是构建执行计划，而不是执行它。

产出：

将工作分解为并行流
各流之间的依赖关系（什么必须先于什么）
质量检查点（在继续之前必须审查输出的地方）
每个执行流的准确简报（每个代理需要知道什么才能完成自己的部分）
最终组装说明（输出如何组合成最终交付物）

不要编写任何实际内容。只写计划。

→ 提示词2：动态工作流任务路由：

本周我需要完成以下任务：

[列出你的任务]

将它们分为两组：

A组——由Opus处理（推理密集型、判断类、模糊、高风险）： [Opus级别的标准：架构决策、质量评审、战略分析，任何错误会有下游后果的任务]

B组——由Kimi Agent Swarm处理（执行密集型、批量处理、可规模化重复、明确输出规格）： [Kimi级别的标准：研究N个来源、生成N个文件、转换N个输入，任何输出规格清晰且工作可并行的任务]

对于每个B组任务，写出Kimi Agent Swarm将收到的准确项目简报。对于每个A组任务，直接处理。

→ 提示词3：执行前的质量标准定义：

Kimi Agent Swarm即将执行以下项目：

[描述项目]

在它运行之前，我需要一个质量评分标准。

定义：

每个交付物类型的合格输出是什么样的
不合格输出是什么样的（要具体——不是“低质量“，而是“缺少引用“、“少于500字”、“格式错误”）
此类任务最常见的3种失败模式
如何在输出进入最终组装阶段之前发现每种失败模式

此评分标准将用于在接收Agent Swarm输出之前对其进行审查。

→ 提示词4：Opus审查Kimi输出：

Kimi Agent Swarm已完成以下项目：

项目简报：[要求什么] 输出：[粘贴或总结输出内容]

对照质量评分标准进行审查： [粘贴提示词3中的评分标准]

对于每个交付物：

针对每个评分标准通过或失败
需要修复的具体问题（引用确切问题）
该问题需要完全重新运行还是针对性地修复

生成修改简报：Kimi需要修复的内容，以相同的项目简报格式，以便无需重新解释即可直接发送。

→ 提示词5：Opus从Kimi的各个部分组装最终输出：

Kimi Agent Swarm生成了以下输出：

[列出或粘贴输出]

这些是以下组件的组成部分：[描述最终交付物]

你的任务是将它们组装成连贯的最终输出。

规则：

不要重写已经有效的内容。连接并整合。
识别并修复不同部分之间的不一致
确保最终输出读起来像一个统一的整体，而不是拼凑物
标记任何需要我在定稿前审查的内容

最终格式：[准确描述组装后的输出应该是什么样]

Opus 4.8 每百万token 15美元，仅编排（工作流的30%）：18,600美元/月 Kimi K2.6 每百万token 0.60美元，执行（工作流的70%）：1,240美元/月对比全部使用Opus 4.8：62,000美元/月每月节省：42,160美元

2/3 | 执行：Kimi K2.6 Agent Swarm在Opus规划时做什么

Kimi K2.6 Agent Swarm并行运行300个领域专业子代理。每个代理处理项目简报的一部分。它们跨最多4000个步骤进行协调。输出以真实文件的形式到达：PDF、电子表格、网站、数据集、代码。

当Opus移交简报时，这所取代的财务现实：

50个竞争对手着陆页的研究简报：代理费用25,000美元。Kimi用4-6美元的token执行。

从潜在客户名单生成100封定制外联邮件：文案费用2,000-5,000美元。Kimi一次性执行Opus定义的简报。

跨30个代码库的技术审计：顾问时间15,000-40,000美元。Kimi Agent Swarm运行Opus定义的规格。Opus审查总结。

组合：Opus定义质量标杆。Kimi大规模执行。Opus审查。Kimi修改。Opus批准。

五个提示词，用于运行执行层。

→ 提示词6：将Opus计划转化为Kimi项目简报：

获取以下由Claude Opus生成的执行计划：

[粘贴提示词1中的Opus计划]

将其改写为Kimi Agent Swarm的项目简报。

格式：项目：[一行总结] 输入：[附件文件、URL、数据] 输出：[文件类型/数量/命名规范/格式] 阶段1：[第一个执行流——代理做什么、产出什么] 阶段2：[第二个流——注明依赖] 阶段3：[组装——输出如何组合] 质量备忘：[每个输出必须达到的最低标准]

简报应足够完整，使Agent Swarm无需澄清即可执行。

→ 提示词7：带输出规范的批量执行：

项目：[描述批量任务] 输入：[N个项目——附加文件或列出它们] 输出规范：[准确格式、文件类型、命名规范、每个输入对应一个输出]

对于每个输入：

[步骤1：做什么]
[步骤2]
[步骤3]
输出：[交付物的准确格式]

质量标准：[最低要求——字数、引用格式、结构等]

并行运行所有[N]个输入。以[文件格式]交付，命名规范为[规范]。

→ 提示词8：一步完成研究到交付物：

研究阶段：搜索[主题/竞争对手/主体]跨[N]个来源。对每个来源提取：[具体数据点列表] 输出：结构化数据集，每个来源一行。

分析阶段：使用研究数据集，识别：[模式/空白/机会/排名] 标记任何数据不清晰或矛盾来源。

交付阶段：使用研究和分析生成[最终输出格式]。格式：[准确规范] 长度：[字数或页数] 引用：[格式]

总输出：一个[文件类型]，一个支持数据集。

→ 提示词9：将工作流保存为可复用的技能：

我们刚刚完成了以下工作流：

Opus定义：[Opus规划了什么] Kimi执行：[Kimi运行了什么] 输出：[产出了什么]

将其保存为名为[名称]的可复用技能。

文档：

触发器（什么类型的请求激活此技能）
Opus编排提示词（发送给Opus以生成简报的内容）
Kimi执行简报模板（发送给Agent Swarm的内容）
Opus审查清单（Opus在接受输出前检查什么）
预期输入和输出

下次运行此工作流时，我希望从技能开始，而不是从头开始。

→ 提示词10：每次工作流运行的成本跟踪：

此工作流刚刚运行：

Opus 4.8任务： [列出Opus处理的每个任务，估计token数]

Kimi K2.6任务： [列出Kimi处理的每个任务，估计token数]

计算：

Opus成本：[token数] × 每千token 0.015美元
Kimi成本：[token数] × 每千token 0.0006美元
总实际成本
如果完全在Opus上运行此工作流的成本
本次运行节省

将此记录到WORKFLOW_COSTS.md，包含日期、工作流名称和明细。

50个竞争对手着陆页（人工研究）：25,000美元 100封定制外联邮件（文案）：2,000-5,000美元 30个代码库技术审计（顾问）：15,000-40,000美元 Kimi执行+Opus质量简报：每个工作流12-40美元token

3/3 | 系统：将账单削减88%的路由决策

达到每月7,800美元（从62,000美元）的团队并不是用Kimi替代Opus。

他们构建了一个路由层。

进入工作流的每个任务都被分类：这需要判断，还是需要执行？答案决定了哪个模型来处理。

判断：模糊的简报、质量决策、架构判断、综合矛盾信息，任何错误会向下游级联的。Claude Opus 4.8。

执行：清晰的输出规范、可规模化重复、高容量、确定性质量标准，任何简报中完全定义了合格输出的。Kimi K2.6 Agent Swarm。

路由规则：如果你能写出一个机器可以评分的评分标准，Kimi执行。如果你写不出这样的评分标准，Opus处理。

五个提示词。完整的路由系统。

→ 提示词11：每周工作流审计：

审查我们本周运行的以下工作流：

[列出工作流]

对于每个工作流，对每个任务进行分类：

仅Opus：判断密集型，无明确评分标准
仅Kimi：执行密集型，清晰输出规范，易于并行
混合：Opus规划 + Kimi执行 + Opus审查

对于每个混合工作流，写出交接点：

Opus在交接前产出什么（简报）
Kimi接收什么（执行规格）
Opus之后审查什么（质量评分标准）

标记任何当前在Opus上但应移至Kimi的任务。

→ 提示词12：构建路由决策树：

我需要一个针对我们重复工作流类型的路由框架。

对于下面每种工作流类型，定义：

哪个模型处理每个阶段（Opus/Kimi/两者）
将其路由到正确模型的触发器
模型之间的交接格式
每次运行的成本估算

工作流类型：

[类型1，例如内容研究+生产]
[类型2，例如竞争对手分析]
[类型3，例如外联个性化]
[类型4，例如代码审查+重构]

输出：一个路由表，我可以在30秒内对任何进入的请求进行分类。

→ 提示词13：月度成本优化审查：

上个月我们通过AI工作流运行了以下量：

[描述量——例如200个研究简报、500封外联邮件、30个代码审计]

当前配置：[描述当前什么给Opus vs Kimi] 当前月度成本：[金额]

分析：

哪些工作流过度分配给了Opus，而Kimi可以处理
哪些工作流当前在Kimi上，但为了质量应由Opus处理
最优分配看起来如何
在最优分配下的预计成本

生成路由更改建议，并附上预计月度节省。

→ 提示词14：交接提示词模板：

为以下工作流创建一个标准交接模板：

当Opus完成[任务类型]时，产出[输出格式]。 Kimi Agent Swarm接收此内容并执行[执行任务]。然后Opus审查[审查标准]。

写：

Opus输出格式（作为Kimi的简报，结构化、无歧义）
Kimi执行简报模板（供Opus填入的插槽）
Opus审查清单（Kimi输出被评分的5个标准）
修改循环：如果Kimi输出失败，返回什么以及什么格式

此模板成为此工作流类型两个模型之间的永久接口。

→ 提示词15：面向利益相关者的ROI报告：

为我们Opus 4.8 + Kimi K2.6工作流配置生成月度ROI报告。

包括：

本月运行的工作流总数：[N]
处理量：[N个项目/文件/任务]
成本明细：
- Opus 4.8支出：[金额]美元
- Kimi K2.6支出：[金额]美元
- 总计：[金额]美元
如果所有工作流完全运行在Opus 4.8上的等效成本：[计算金额]美元
月度节省：[金额]美元
年化节省：[金额×12]美元
质量事故（未通过审查需要重新运行的工作流）：[N]
质量事故率：[%]

格式为高管摘要。一页。数字优先。

所有工作流在Opus 4.8上运行：62,000美元/月 Opus编排+Kimi执行：7,800美元/月月度节省：54,200美元年度节省：650,400美元此配置下的质量事故：相同或更低（Opus审查所有最终输出）

结论

以下是2026年5月28日发生的变化。

Anthropic发布了带有动态工作流的Claude Opus 4.8。它旨在跨数百个并行子代理管理复杂任务执行。而不是成为那些子代理。而是管理它们。

Kimi K2.6随Agent Swarm一起发布。300个专业子代理。4000个协调步骤。每百万token 0.60美元。

这些不是竞争模型。它们是为同一系统的不同层级构建的。

Opus 4.8编排层（工作流的30%）：18,600美元/月 Kimi K2.6执行层（工作流的70%）：1,240美元/月总计：19,840美元/月对比全部使用Opus 4.8：62,000美元/月年度节省：650,400美元

那些在4月和5月就弄明白的团队，现在运行着每月7,800美元的AI基础设施，产出过去需要62,000美元的东西。还没弄明白的团队仍在将一切路由到市场上最昂贵的模型，用于那些并不需要的任务。

15个提示词。两个模型。这个工作流便宜了88%，但并不慢，质量也不低。

同样的输出。以它本应一直拥有的价格。

在它被淹没之前收藏这篇文章。如果它对你有用，分享给一个需要它的人。

@0xDepressionn: https://x.com/0xDepressionn/status/2062185806999994444

15个提示词，把我的编码账单从7800美元砍到129美元

大多数团队忽略的配置

1/3 | 编排：Opus 4.8的真正用途

2/3 | 执行：Kimi K2.6 Agent Swarm在Opus规划时做什么

3/3 | 系统：将账单削减88%的路由决策

结论

相似文章

@andreysuperior: https://x.com/andreysuperior/status/2058539604391735714

24/7代理管线将开发生产级软件的成本和时间降低了60-70%。

@DeRonin_: 我的整个AI栈现在都换成中国产品了，便宜87%。相同收入，按任务替换：1. 推理/后端大脑 Opus 4.8 → Kimi…

@0xRicker: Anthropic的Claude团队刚刚展示了每月$4,200 AI编码账单的真正解决方案——15分钟。免费。由打造它的人…

我的AI代理账单从每周200美元降到40美元，当我停止在每个子任务上都使用Opus时

提交意见反馈