@FinanceYF5: 后悔Fable 5被叫停前没有用上?他连续跑了 6 天 1/ 大多数人把 Fable 5 当更快的聊天框 有人让一个 Fable 5 智能体连续跑了 6 天、没人掌舵,才动笔写下结论:九成人只用到了它 10% 的能力。 它为「连续跑几天」…

X AI KOLs Following 新闻

摘要

一位用户让Fable 5智能体连续运行6天无人干预,得出结论:大多数人仅使用了其10%的能力。

后悔Fable 5被叫停前没有用上?他连续跑了 6 天👇 1/ 🚀 大多数人把 Fable 5 当更快的聊天框 有人让一个 Fable 5 智能体连续跑了 6 天、没人掌舵,才动笔写下结论:九成人只用到了它 10% 的能力。 它为「连续跑几天」而生,人们却只用几分钟。 https://t.co/bCqmgKh0Vp
查看原文
查看缓存全文

缓存时间: 2026/06/16 17:38

后悔Fable 5被叫停前没有用上?他连续跑了 6 天👇

1/ 🚀 大多数人把 Fable 5 当更快的聊天框

有人让一个 Fable 5 智能体连续跑了 6 天、没人掌舵,才动笔写下结论:九成人只用到了它 10% 的能力。

它为「连续跑几天」而生,人们却只用几分钟。 https://t.co/bCqmgKh0Vp

后悔Fable 5被叫停前没有用上?他连续跑了 6 天

1/ 大多数人把 Fable 5 当更快的聊天框

有人让一个 Fable 5 智能体连续跑了 6 天、没人掌舵,才动笔写下结论:九成人只用到了它 10% 的能力。

它为「连续跑几天」而生,人们却只用几分钟。

2/ 真正的分水岭:自我学习 vs 自我改进

自我学习是模型改自己的权重,Fable 5 不做,目前没有量产模型做。

自我改进是模型外面的系统在复利:每次运行把教训写进记忆,技能越用越利。模型不变,环境每跑一次都更聪明。

3/ 把复利栈从底往上搭四层

底层是原语:Fable 5、子智能体、worktree,多数人只碰到这层。 第二层是编排:目标循环、动态工作流、云端 Routines。 第三层是记忆:状态文件、Skills、知识库。 顶层是自我改进:视觉自检、评估循环、规则蒸馏。

4/ 别什么都丢给 Fable 5 跑

它每 token 约是 Opus 4.8 的 5 倍贵(10/百万输入、50/百万输出)。

让 Fable 5 当编排者,Sonnet 4.6 干量大的活,Haiku 4.5 当打分员,被安全分类器拦截时自动回退 Opus 4.8。

5/ 永远别让模型给自己打分

Anthropic 自己的实验:带独立验证者的版本敢做更大改动,硬把一次失败的实验推到最大胜果;自己打分的版本只敢微调一个安全参数,早早收手。

写代码的智能体,永远不该是给它打分的那个。

6/ 记忆的五个阶段:失败→调查→验证→蒸馏→查阅

Sonnet 4.6 多半停在第一步,堆一堆没人再看的失败笔记。 Fable 5 能走完全程,最强时验证覆盖率冲到 70% 多,把事实蒸馏成可复用规则。

差距不在模型,在你有没有状态文件。

7/ 自我改进是系统的属性,不是模型的

每个证明这点的实验里,两边的模型一模一样。变的是外面的系统:验证者、状态文件、评估循环。

挑一层你还没做的,明天就加上,然后加下一层。

阅读原文:

以上就是全部

如果您喜欢这个主题:

1.关注我(@FinanceYF5) 2. 点赞+转发下面第一条帖子

1/ a16z 一周四张图:AI 正在重新定价一切

制造业回流、美国人喝酒、搜索点击、SaaS 股价,四件看似无关的事,指向同一个分化。

讲不出 AI 故事的,都在被甩开。

相似文章