@DeRonin_: 我跑了一整天Fable 5，却还没触及我的极限，为什么？因为我在这里停止了为闲聊支付高昂的费用……

X AI KOLs Following 2026/07/02 16:41 新闻

摘要

一位用户分享了一种高效使用多个AI模型（Fable、Opus、Codex、DeepSeek、GLM、Qwen、Kimi）的详细工作流策略，通过根据成本和能力委派任务、使用单个CLAUDE.md路由表、以及避免闲聊来减少token使用。

我跑了一整天Fable 5，却还没触及我的极限为什么？我不再为闲聊支付高昂的费用了以下是我实际运行它的方式： 1. 我不跟它闲聊每次说“谢谢”都会让它以自身价格重新读取整个对话它是建筑师，不是室友。Fable现在把Opus 4.8当作新的Haiku来用，所以我把日常任务（站会、清理、小编辑）推给Opus，把Fable留给真正的问题。 2. 我通过一个CLAUDE.md路由所有内容这是关键的一步。我在CLAUDE.md中维护一个单一的路由表，让Fable作为协调器读取并调度任务。文件的大致结构如下： - Fable → 规划、架构、审查每个阶段 - Opus / Codex → 实现劳动 - DeepSeek + GLM + Qwen（极其便宜）→ 大量基础工作：样板代码、测试编写、数据清洗、翻译、初稿文档 - Kimi / 长上下文模型 → 读取大文件，这样Fable就不会在它们上花费token Fable从不直接处理廉价工作。它规划、按任务委托给合适的层级，然后根据计划进行检查。昂贵的大脑只花token做决策。就那一个文件，让我的账单下降了，而产出却增加了。 3. 一个大的简报，而不是二十个小的提示它能记住数小时的上下文，所以我一次性把整个混乱的东西交给它：全部上下文、约束条件、以及我真正担心的事。我把拖延了几周的重构任务用一次简报交给它，它很快就完成了。逐行投喂会浪费它最擅长的事。 4. 我用防御性的措辞构建请求，以避开分类器新的分类器很敏感，而且是政府强制要求的。无害的提示（尤其是安全或生物相关的内容）会被悄悄降级到Opus。我通过惨痛教训学到了这一点。现在我采用防御性措辞：“审查此内容以确保合规”，而不是“查找漏洞”。如果它还是触发了，我不与它争辩。开新聊天，换一种中立措辞，继续前进。 5. 我从不要求它解释推理过程那一个请求可能会触发同样的过滤器，你的工作会在你自以为还在使用Fable时被悄悄交给一个更弱的模型处理。 6. 我给它一个无法伪造的终点线我不写“让它工作”，而是写“运行测试、粘贴输出、或在25轮后停止”。我有一次没有设置刹车，眼睁睁看着它烧掉了我整个下午。还有人在一次提示中被收费960美元。粘贴输出这一行也杜绝了虚假的“完成”报告。 7. 我把它留给我桌上最难的任务如果你把它当廉价模型用，它的表现也会像廉价模型，只是花费更多。差距只有在足够困难的问题上才会显现。所以我会把拖延了3周的任务交给它。把专家当作专家来用，你的额度就能撑过整周。祝好运

查看原文

查看缓存全文

缓存时间: 2026/07/02 20:27

我整天运行Fable 5，仍未触及上限

为什么？

我不再为闲聊支付外科医生级别的费用

以下是我实际使用它的方法：

我不和它闲聊

每次说“谢谢”都会让它以自身价格重新读取整个对话

它是架构师，不是室友。Fable现在把Opus 4.8当作新的Haiku对待，所以我把日常任务（站会、清理、小修改）推给Opus，把Fable留着解决真正的问题

我通过一个CLAUDE.md路由所有任务

这是关键。我在CLAUDE.md里维护一个单一路由表，让Fable作为编排器读取并分派任务

文件的大致结构：

Fable → 规划、架构、审查每个阶段
Opus / Codex → 实施劳动
DeepSeek + GLM + Qwen（极其便宜）→ 批量基础工作：模板代码、测试编写、数据清理、翻译、初稿文档
Kimi / 长上下文模型 → 读取大文件，这样Fable就不会把token花在这上面

Fable从不直接处理廉价工作。它规划、按任务分派给合适的层级，然后对照计划检查。昂贵的大脑只花token做决策

那一个文件就是我的账单下降而产出上升的原因

一个大简报，而不是二十个小提示

它能记住数小时的上下文，所以我一次性把整个混乱的东西交给它：完整上下文、限制条件、我真正担心的事情

我给了一个让我担心了几周的重构任务，用一个简报完成，它返回了完成结果。逐行投喂浪费了它最擅长的一点

我防御性地构建请求以绕过分类器

新的分类器很敏感且受政府强制要求。无害的提示（尤其是安全或生物相关）会被悄然降级到Opus

我吃了苦头才学会。现在我防御性地措辞：“检查合规性”而不是“找出漏洞”

如果还是触发，我不会和它争辩。新聊天，中性措辞，继续前进

我从不要求它解释推理过程

那个请求可能触发同一过滤器，你的工作会被一个较弱模型悄悄处理，而你却以为自己仍在Fable上

我给它一个它无法伪造的终点线

我不写“实现功能”，而是写“运行测试，粘贴输出，或在25轮后停止”

我跳过了一次刹车，结果看着它烧掉整个下午。有人曾因为一个提示被收取960美元。要求粘贴证据也能消除虚假的“完成”报告

我把它留给我桌上最难的事情

如果你把它当便宜模型用，它的表现就像便宜模型，只是更贵

差距只在足够困难的问题上显现。所以我给它带来我已经拖延三周的事情

像专家一样使用专家，你的上限能撑一整周

祝好

@DeRonin_: 我跑了一整天Fable 5，却还没触及我的极限，为什么？因为我在这里停止了为闲聊支付高昂的费用……

相似文章

我用了半天的Fable 5，发现护栏才是真正的故事

@DeRonin_: https://x.com/DeRonin_/status/2054235707791778034

@DeRonin_: 我实际如何在模型之间路由：推文草稿：Sonnet 4.6 长篇文章：Opus 4.6 代码工作：Kimi 2.6 代理…

一篇真正讨论人们使用Fable体验的帖子

@diegocabezas01：使用 Fable 5 作为编排器，Opus + Codex 执行（以节省 Fable 用量）：Fable 5（最大推理）= 编排器 O…

提交意见反馈