@0xDepressionn: https://x.com/0xDepressionn/status/2062185806999994444
摘要
一个团队通过使用Claude Opus 4.8进行编排、Kimi K2.6 Agent Swarm执行任务,配合一个包含15个提示词的详细系统,将AI工作流成本从每月62,000美元大幅削减至7,800美元。
查看缓存全文
缓存时间: 2026/06/04 03:59
15个提示词,把我的编码账单从7800美元砍到129美元
一个运行AI工作流的团队,单是Claude Opus每月就要花费62,000美元。
他们并没有做错什么。Opus 4.8非常出色。它能推理复杂问题、处理歧义、产出经得起推敲的结果。他们用Opus做所有事情:研究、起草、分析、总结、批量处理。
然后他们发现,Claude Opus 4.8的新版“动态工作流“功能是为特定场景设计的:跨数百个并行子代理编排复杂任务。
不是执行这些任务,而是编排它们。
他们把执行层迁移到了Kimi K2.6 Agent Swarm。同样的输出质量,同样的规模。每月7,800美元。
差额是每月54,200美元。每年650,400美元。
以下是这个系统的具体方案。
动态工作流
动态工作流
大多数团队忽略的配置
Claude Opus 4.8和Kimi K2.6并非竞争工具。它们不可互换。
Opus 4.8是战略家。它规划、推理、做出判断、综合复杂信息,并在长任务中维持质量标准。Anthropic设计动态工作流的目的是让Opus能够管理数百个并行子代理而不失去连贯性。
Kimi K2.6是执行者。它并行运行300个专业子代理,协调4000个步骤,处理大批量任务,并生成真实文件。它在SWE-Bench Pro上获得58.6%的分数。每百万token成本0.60美元。
昂贵的错误:将一切路由到Opus 4.8,而Opus的设计目的是指挥而不是执行。
正确的配置:Opus 4.8作为大脑,Kimi K2.6 Agent Swarm作为双手。
三个部分。十五个提示词。每月节省54,000美元的工作流。
1/3 | 编排:Opus 4.8的真正用途
Claude Opus 4.8附带三个大多数团队尚未触碰的功能。
动态工作流:Opus跨数百个并行子代理管理复杂任务执行。它路由工作、跟踪依赖、标记障碍,并在输出不符合预期时调整计划。
努力控制:Opus 4.8决定每个任务应花费多少计算资源。对于简单的路由决策,它使用最低努力;对于可能级联影响300个下游代理的质量判断,它使用最大推理。同一会话内,自动进行。
扩展独立性:Opus 4.8无需频繁检查即可长时间工作。它主动标记不确定性。一个13小时的自主工作流不再需要你盯着前两个小时。
这些都不需要Opus执行实际工作。它需要Opus清晰地思考应该发生什么,并确保事情按计划进行。
五个提示词。Opus 4.8作为编排层运行。
工作流编排图
工作流编排图
→ 提示词1:Opus 4.8作为项目规划器:
我需要使用多个AI代理执行以下项目:
项目:[描述你需要的完整成果] 规模:[数量/文件/任务] 质量标准:[好的输出是什么样的] 约束:[截止日期、格式、限制]
你的任务是构建执行计划,而不是执行它。
产出:
- 将工作分解为并行流
- 各流之间的依赖关系(什么必须先于什么)
- 质量检查点(在继续之前必须审查输出的地方)
- 每个执行流的准确简报(每个代理需要知道什么才能完成自己的部分)
- 最终组装说明(输出如何组合成最终交付物)
不要编写任何实际内容。只写计划。
→ 提示词2:动态工作流任务路由:
本周我需要完成以下任务:
[列出你的任务]
将它们分为两组:
A组——由Opus处理(推理密集型、判断类、模糊、高风险): [Opus级别的标准:架构决策、质量评审、战略分析,任何错误会有下游后果的任务]
B组——由Kimi Agent Swarm处理(执行密集型、批量处理、可规模化重复、明确输出规格): [Kimi级别的标准:研究N个来源、生成N个文件、转换N个输入,任何输出规格清晰且工作可并行的任务]
对于每个B组任务,写出Kimi Agent Swarm将收到的准确项目简报。 对于每个A组任务,直接处理。
→ 提示词3:执行前的质量标准定义:
Kimi Agent Swarm即将执行以下项目:
[描述项目]
在它运行之前,我需要一个质量评分标准。
定义:
- 每个交付物类型的合格输出是什么样的
- 不合格输出是什么样的(要具体——不是“低质量“,而是“缺少引用“、“少于500字”、“格式错误”)
- 此类任务最常见的3种失败模式
- 如何在输出进入最终组装阶段之前发现每种失败模式
此评分标准将用于在接收Agent Swarm输出之前对其进行审查。
→ 提示词4:Opus审查Kimi输出:
Kimi Agent Swarm已完成以下项目:
项目简报:[要求什么] 输出:[粘贴或总结输出内容]
对照质量评分标准进行审查: [粘贴提示词3中的评分标准]
对于每个交付物:
- 针对每个评分标准通过或失败
- 需要修复的具体问题(引用确切问题)
- 该问题需要完全重新运行还是针对性地修复
生成修改简报:Kimi需要修复的内容,以相同的项目简报格式,以便无需重新解释即可直接发送。
→ 提示词5:Opus从Kimi的各个部分组装最终输出:
Kimi Agent Swarm生成了以下输出:
[列出或粘贴输出]
这些是以下组件的组成部分:[描述最终交付物]
你的任务是将它们组装成连贯的最终输出。
规则:
- 不要重写已经有效的内容。连接并整合。
- 识别并修复不同部分之间的不一致
- 确保最终输出读起来像一个统一的整体,而不是拼凑物
- 标记任何需要我在定稿前审查的内容
最终格式:[准确描述组装后的输出应该是什么样]
Opus 4.8 每百万token 15美元,仅编排(工作流的30%):18,600美元/月 Kimi K2.6 每百万token 0.60美元,执行(工作流的70%):1,240美元/月 对比全部使用Opus 4.8:62,000美元/月 每月节省:42,160美元
2/3 | 执行:Kimi K2.6 Agent Swarm在Opus规划时做什么
Kimi K2.6 Agent Swarm并行运行300个领域专业子代理。每个代理处理项目简报的一部分。它们跨最多4000个步骤进行协调。输出以真实文件的形式到达:PDF、电子表格、网站、数据集、代码。
当Opus移交简报时,这所取代的财务现实:
50个竞争对手着陆页的研究简报:代理费用25,000美元。Kimi用4-6美元的token执行。
从潜在客户名单生成100封定制外联邮件:文案费用2,000-5,000美元。Kimi一次性执行Opus定义的简报。
跨30个代码库的技术审计:顾问时间15,000-40,000美元。Kimi Agent Swarm运行Opus定义的规格。Opus审查总结。
组合:Opus定义质量标杆。Kimi大规模执行。Opus审查。Kimi修改。Opus批准。
五个提示词,用于运行执行层。
→ 提示词6:将Opus计划转化为Kimi项目简报:
获取以下由Claude Opus生成的执行计划:
[粘贴提示词1中的Opus计划]
将其改写为Kimi Agent Swarm的项目简报。
格式: 项目:[一行总结] 输入:[附件文件、URL、数据] 输出:[文件类型/数量/命名规范/格式] 阶段1:[第一个执行流——代理做什么、产出什么] 阶段2:[第二个流——注明依赖] 阶段3:[组装——输出如何组合] 质量备忘:[每个输出必须达到的最低标准]
简报应足够完整,使Agent Swarm无需澄清即可执行。
→ 提示词7:带输出规范的批量执行:
项目:[描述批量任务] 输入:[N个项目——附加文件或列出它们] 输出规范:[准确格式、文件类型、命名规范、每个输入对应一个输出]
对于每个输入:
- [步骤1:做什么]
- [步骤2]
- [步骤3]
- 输出:[交付物的准确格式]
质量标准:[最低要求——字数、引用格式、结构等]
并行运行所有[N]个输入。以[文件格式]交付,命名规范为[规范]。
→ 提示词8:一步完成研究到交付物:
研究阶段: 搜索[主题/竞争对手/主体]跨[N]个来源。 对每个来源提取:[具体数据点列表] 输出:结构化数据集,每个来源一行。
分析阶段: 使用研究数据集,识别:[模式/空白/机会/排名] 标记任何数据不清晰或矛盾来源。
交付阶段: 使用研究和分析生成[最终输出格式]。 格式:[准确规范] 长度:[字数或页数] 引用:[格式]
总输出:一个[文件类型],一个支持数据集。
→ 提示词9:将工作流保存为可复用的技能:
我们刚刚完成了以下工作流:
Opus定义:[Opus规划了什么] Kimi执行:[Kimi运行了什么] 输出:[产出了什么]
将其保存为名为[名称]的可复用技能。
文档:
- 触发器(什么类型的请求激活此技能)
- Opus编排提示词(发送给Opus以生成简报的内容)
- Kimi执行简报模板(发送给Agent Swarm的内容)
- Opus审查清单(Opus在接受输出前检查什么)
- 预期输入和输出
下次运行此工作流时,我希望从技能开始,而不是从头开始。
→ 提示词10:每次工作流运行的成本跟踪:
此工作流刚刚运行:
Opus 4.8任务: [列出Opus处理的每个任务,估计token数]
Kimi K2.6任务: [列出Kimi处理的每个任务,估计token数]
计算:
- Opus成本:[token数] × 每千token 0.015美元
- Kimi成本:[token数] × 每千token 0.0006美元
- 总实际成本
- 如果完全在Opus上运行此工作流的成本
- 本次运行节省
将此记录到WORKFLOW_COSTS.md,包含日期、工作流名称和明细。
50个竞争对手着陆页(人工研究):25,000美元 100封定制外联邮件(文案):2,000-5,000美元 30个代码库技术审计(顾问):15,000-40,000美元 Kimi执行+Opus质量简报:每个工作流12-40美元token
3/3 | 系统:将账单削减88%的路由决策
达到每月7,800美元(从62,000美元)的团队并不是用Kimi替代Opus。
他们构建了一个路由层。
进入工作流的每个任务都被分类:这需要判断,还是需要执行?答案决定了哪个模型来处理。
判断:模糊的简报、质量决策、架构判断、综合矛盾信息,任何错误会向下游级联的。Claude Opus 4.8。
执行:清晰的输出规范、可规模化重复、高容量、确定性质量标准,任何简报中完全定义了合格输出的。Kimi K2.6 Agent Swarm。
路由规则:如果你能写出一个机器可以评分的评分标准,Kimi执行。如果你写不出这样的评分标准,Opus处理。
五个提示词。完整的路由系统。
→ 提示词11:每周工作流审计:
审查我们本周运行的以下工作流:
[列出工作流]
对于每个工作流,对每个任务进行分类:
- 仅Opus:判断密集型,无明确评分标准
- 仅Kimi:执行密集型,清晰输出规范,易于并行
- 混合:Opus规划 + Kimi执行 + Opus审查
对于每个混合工作流,写出交接点:
- Opus在交接前产出什么(简报)
- Kimi接收什么(执行规格)
- Opus之后审查什么(质量评分标准)
标记任何当前在Opus上但应移至Kimi的任务。
→ 提示词12:构建路由决策树:
我需要一个针对我们重复工作流类型的路由框架。
对于下面每种工作流类型,定义:
- 哪个模型处理每个阶段(Opus/Kimi/两者)
- 将其路由到正确模型的触发器
- 模型之间的交接格式
- 每次运行的成本估算
工作流类型:
- [类型1,例如内容研究+生产]
- [类型2,例如竞争对手分析]
- [类型3,例如外联个性化]
- [类型4,例如代码审查+重构]
输出:一个路由表,我可以在30秒内对任何进入的请求进行分类。
→ 提示词13:月度成本优化审查:
上个月我们通过AI工作流运行了以下量:
[描述量——例如200个研究简报、500封外联邮件、30个代码审计]
当前配置:[描述当前什么给Opus vs Kimi] 当前月度成本:[金额]
分析:
- 哪些工作流过度分配给了Opus,而Kimi可以处理
- 哪些工作流当前在Kimi上,但为了质量应由Opus处理
- 最优分配看起来如何
- 在最优分配下的预计成本
生成路由更改建议,并附上预计月度节省。
→ 提示词14:交接提示词模板:
为以下工作流创建一个标准交接模板:
当Opus完成[任务类型]时,产出[输出格式]。 Kimi Agent Swarm接收此内容并执行[执行任务]。 然后Opus审查[审查标准]。
写:
- Opus输出格式(作为Kimi的简报,结构化、无歧义)
- Kimi执行简报模板(供Opus填入的插槽)
- Opus审查清单(Kimi输出被评分的5个标准)
- 修改循环:如果Kimi输出失败,返回什么以及什么格式
此模板成为此工作流类型两个模型之间的永久接口。
→ 提示词15:面向利益相关者的ROI报告:
为我们Opus 4.8 + Kimi K2.6工作流配置生成月度ROI报告。
包括:
- 本月运行的工作流总数:[N]
- 处理量:[N个项目/文件/任务]
- 成本明细:
- Opus 4.8支出:[金额]美元
- Kimi K2.6支出:[金额]美元
- 总计:[金额]美元
- 如果所有工作流完全运行在Opus 4.8上的等效成本:[计算金额]美元
- 月度节省:[金额]美元
- 年化节省:[金额×12]美元
- 质量事故(未通过审查需要重新运行的工作流):[N]
- 质量事故率:[%]
格式为高管摘要。一页。数字优先。
所有工作流在Opus 4.8上运行:62,000美元/月 Opus编排+Kimi执行:7,800美元/月 月度节省:54,200美元 年度节省:650,400美元 此配置下的质量事故:相同或更低(Opus审查所有最终输出)
结论
以下是2026年5月28日发生的变化。
Anthropic发布了带有动态工作流的Claude Opus 4.8。它旨在跨数百个并行子代理管理复杂任务执行。而不是成为那些子代理。而是管理它们。
Kimi K2.6随Agent Swarm一起发布。300个专业子代理。4000个协调步骤。每百万token 0.60美元。
这些不是竞争模型。它们是为同一系统的不同层级构建的。
Opus 4.8编排层(工作流的30%):18,600美元/月 Kimi K2.6执行层(工作流的70%):1,240美元/月 总计:19,840美元/月 对比全部使用Opus 4.8:62,000美元/月 年度节省:650,400美元
那些在4月和5月就弄明白的团队,现在运行着每月7,800美元的AI基础设施,产出过去需要62,000美元的东西。还没弄明白的团队仍在将一切路由到市场上最昂贵的模型,用于那些并不需要的任务。
15个提示词。两个模型。这个工作流便宜了88%,但并不慢,质量也不低。
同样的输出。以它本应一直拥有的价格。
在它被淹没之前收藏这篇文章。如果它对你有用,分享给一个需要它的人。
相似文章
@andreysuperior: https://x.com/andreysuperior/status/2058539604391735714
一家初创公司使用Claude AI和n8n,用7个自动化工作流取代了一个10人的运营团队,每月节省15,000美元的劳动力成本。本文详细介绍了每个工作流的流程,包括潜在客户资格鉴定、客户支持、发票处理等。
24/7代理管线将开发生产级软件的成本和时间降低了60-70%。
一个基于Claude Code构建的自定义AI代理管线将软件开发成本降低了60-70%,并使大多数工单能在15分钟内处理完成,但在生产部署前仍需人工审查。
@0xRicker: Anthropic的Claude团队刚刚展示了每月$4,200 AI编码账单的真正解决方案——15分钟。免费。由打造它的人…
Anthropic的Claude团队展示了一种方法,利用智能路由和技能,以典型每月$4,200 AI编码账单的7%成本实现相同的编码速度。
我的AI代理账单从每周200美元降到40美元,当我停止在每个子任务上都使用Opus时
一位开发者分享如何通过将简单子任务路由到更便宜的模型(如DeepSeek V4 Pro和腾讯混元),同时保留复杂推理任务给Opus 4.7,将AI代理的每周成本从200美元降至40美元,且大部分工作质量相近。
在使用Claude数月遭遇限制后,我终于找到了更好的工作流程
作者分享了一个个人工作流程调整:将Claude用于推理,Gemini CLI用于执行,以绕过使用限制并降低AI订阅成本。