@DeRonin_: 我跑了一整天Fable 5,却还没触及我的极限,为什么?因为我在这里停止了为闲聊支付高昂的费用……
摘要
一位用户分享了一种高效使用多个AI模型(Fable、Opus、Codex、DeepSeek、GLM、Qwen、Kimi)的详细工作流策略,通过根据成本和能力委派任务、使用单个CLAUDE.md路由表、以及避免闲聊来减少token使用。
查看缓存全文
缓存时间: 2026/07/02 20:27
我整天运行Fable 5,仍未触及上限
为什么?
我不再为闲聊支付外科医生级别的费用
以下是我实际使用它的方法:
- 我不和它闲聊
每次说“谢谢”都会让它以自身价格重新读取整个对话
它是架构师,不是室友。Fable现在把Opus 4.8当作新的Haiku对待,所以我把日常任务(站会、清理、小修改)推给Opus,把Fable留着解决真正的问题
- 我通过一个CLAUDE.md路由所有任务
这是关键。我在CLAUDE.md里维护一个单一路由表,让Fable作为编排器读取并分派任务
文件的大致结构:
- Fable → 规划、架构、审查每个阶段
- Opus / Codex → 实施劳动
- DeepSeek + GLM + Qwen(极其便宜)→ 批量基础工作:模板代码、测试编写、数据清理、翻译、初稿文档
- Kimi / 长上下文模型 → 读取大文件,这样Fable就不会把token花在这上面
Fable从不直接处理廉价工作。它规划、按任务分派给合适的层级,然后对照计划检查。昂贵的大脑只花token做决策
那一个文件就是我的账单下降而产出上升的原因
- 一个大简报,而不是二十个小提示
它能记住数小时的上下文,所以我一次性把整个混乱的东西交给它:完整上下文、限制条件、我真正担心的事情
我给了一个让我担心了几周的重构任务,用一个简报完成,它返回了完成结果。逐行投喂浪费了它最擅长的一点
- 我防御性地构建请求以绕过分类器
新的分类器很敏感且受政府强制要求。无害的提示(尤其是安全或生物相关)会被悄然降级到Opus
我吃了苦头才学会。现在我防御性地措辞:“检查合规性”而不是“找出漏洞”
如果还是触发,我不会和它争辩。新聊天,中性措辞,继续前进
- 我从不要求它解释推理过程
那个请求可能触发同一过滤器,你的工作会被一个较弱模型悄悄处理,而你却以为自己仍在Fable上
- 我给它一个它无法伪造的终点线
我不写“实现功能”,而是写“运行测试,粘贴输出,或在25轮后停止”
我跳过了一次刹车,结果看着它烧掉整个下午。有人曾因为一个提示被收取960美元。要求粘贴证据也能消除虚假的“完成”报告
- 我把它留给我桌上最难的事情
如果你把它当便宜模型用,它的表现就像便宜模型,只是更贵
差距只在足够困难的问题上显现。所以我给它带来我已经拖延三周的事情
像专家一样使用专家,你的上限能撑一整周
祝好
相似文章
我用了半天的Fable 5,发现护栏才是真正的故事
Anthropic的Fable 5模型展现了令人印象深刻的推理和上下文处理能力,但存在高延迟、高成本以及在特定领域静默回退到Opus 4.8的问题,这可能会中断工作流程。
@DeRonin_: https://x.com/DeRonin_/status/2054235707791778034
一份实用指南,介绍了如何通过更智能的 Token 管理(包括多模型路由、提示词缓存和上下文纪律)来降低 80% 的 AI 编码成本,而不是简单地切换到更便宜的模型。
@DeRonin_: 我实际如何在模型之间路由:推文草稿:Sonnet 4.6 长篇文章:Opus 4.6 代码工作:Kimi 2.6 代理…
一位用户分享了他们在不同任务(如推文草稿、文章、代码、代理循环和图像生成)之间使用各种AI模型的个人路由策略,并认为单一模型配置会导致更高成本。
一篇真正讨论人们使用Fable体验的帖子
一位用户分享了使用Fable AI模型分析一份关于日本文学的180页文档的积极体验,指出尽管令牌使用量很高,但它的表现优于其他模型。
@diegocabezas01:使用 Fable 5 作为编排器,Opus + Codex 执行(以节省 Fable 用量):Fable 5(最大推理)= 编排器 O…
一条推文串,解释了如何在 Claude Code 中将 Fable 5 配置为编排器,Opus 和 Sonnet 作为子代理,以及 Codex 作为同级工程师,以优化模型使用和任务委派。