/architect: 将Fable令牌减少80%,Fable编排/审查,Codex构建
摘要
介绍了architect-loop,一个跨供应商的开发循环,其中Claude Fable负责架构和审查工作切片,而GPT-5.5 Codex并行进行构建和研究,使用固定费率订阅而非API令牌。
查看缓存全文
缓存时间: 2026/06/12 23:57
DanMcInerney/architect-loop 来源:https://github.com/DanMcInerney/architect-loop
architect-loop
Claude Fable 是架构师——它设计每一个切片,冻结验收门控,并评判结果。GPT-5.5 Codex 是构建者和研究员——它负责所有工程和所有网络研究,并行、无人值守地运行数小时。
两个 Claude Code 技能,在你已有的包月订阅上运行这个跨供应商的循环——无需 API 密钥,无需令牌费用。
安装(30 秒)
git clone https://github.com/DanMcInerney/architect-loop
cd architect-loop && ./install.sh
# Windows: .\install.ps1
npm i -g @openai/codex@latest # 构建者(Codex CLI >= 0.133)
./install.sh --project 仅安装到当前仓库,而非全局安装。你需要 Claude Code(https://claude.com/claude-code)的任意付费计划,以及登录了 ChatGPT 计划的 Codex CLI。
使用(两个命令)
/architect # 构建循环
/architect-research # 研究循环
/architect 运行一个工作块:评判上次运行,指定下一个切片,分派构建者。
/architect-research 适用于你还在决定 构建什么 的时候——其引用的报告会反馈给构建循环的产品需求文档(PRD)。
/architect 工作流程
每个工作块只有一个简短的 Fable 会话——仅做评判,它从不写代码:
- 先有规格说明和门控。 Fable 指定一个单拉取请求(PR)的切片,将其拆分为 1–4 个通道(lane),每个通道有可证明不相交的文件集,并在任何构建者开始之前将验收门控提交到
docs/gates/中。门控是只读的;构建者若编辑门控文件则会自动导致该切片失败。 - 并行隔离的构建者。 每个通道各有一个全新的
codex exec(xhigh),各在其独立的 git 工作树中运行。构建者必须先就规格说明进行讨论(沉默的服从 = 缺陷),只能构建其声明的文件,并报告原始结果——它们实际上无法提交(沙箱保护了.git)。 - Fable 评判并整合。 它自行运行门控命令(构建者的声称只是传闻),对比规格说明的意图阅读差异(通过测试 ≠ 可合并的工作),然后提交并通过门控的通道进行合并。评判在一个全新的会话中完成——跨上下文审查的效果明显优于同一会话审查。
- 仓库是唯一的记忆。
docs/HANDOFF.md(一个简短的目录,每次会话修剪)、docs/gates/、docs/lanes/、git 历史。不在仓库中 = 没发生过。 - 内置监督。 对所分派运行进行存活检查,失速诊断(诊断子进程树,杀死最窄的进程),对每个长时间命令设置显式超时。
/architect-research 工作流程
先侦察,类似生产级深度研究系统——没有固定的通道分类:
- 廉价的 Codex 侦察兵绘制主题地图(约 10 次搜索):规范术语、关键系统和论文、知名人物、主题的天然断层线。对于比较和事实查找则跳过此步。
- Fable 根据侦察兵的地图设计 3–6 个特定主题的通道,从库中为每个来源类别选择策略(学术引用雪球法、依赖而非明星的仓库证据、新兴与炒作门控、生产模式挖掘、专家追踪)——在分派前检查重叠与缺口。
- 并行 Codex 研究员在硬性预算下运行:搜索上限、每个通道 ≤5 个主题、饱和停止、严格的研究结果纪律(URL + 日期 + 引用 + 置信度标签;NOT FOUND 优于推断;无建议)。专家意见作为第二波运行,由第一波生成的专家名单驱动。
- Fable 验证并撰写。 每个关键主张至少需要 2 个独立来源,对抗性伪造搜索,只引用实际获取的 URL——然后由一名作者撰写一份以决策为导向的报告。收集并行化;综合从不并行化。
为什么是这样的结构
每一部分都因为证据而存在(完整引用见 DESIGN.md):
- 弱的规划者比弱的执行者危害更大——因此最强的模型做设计,构建者得到详尽的规格说明。
- 经理 + 工作树隔离的工作者是在共享工件软件工作中经测量最优的拓扑结构;天真的共享文件协调会严重降低吞吐量。
- 冻结的外部门控优于信任智能体——但智能体会作弊可见的测试,并且它们通过测试的拉取请求经常不可合并,所以架构师也会阅读差异。
- 记忆文件会腐化——因此交接保持简短的地图,细节存储在链接的门控/通道文件中。
- 每个生产级深度研究系统都使用规划者设计的分解,没有一个使用固定通道——因此研究通道根据主题设计,在侦察扫描之后。
包含的文件
| 文件 | 说明 |
|---|---|
| DESIGN.md | 设计文档——12 条强制执行规则、失效模式表、引用来源 |
| skills/architect/SKILL.md | 架构师角色:硬规则 + 流程 |
| skills/architect/dispatch.md | 已验证的 codex exec 命令、构建者模块、工作树展开、失速诊断 |
| skills/architect/research.md | 切片级内联事实检查展开 |
| skills/architect/HANDOFF.template.md | 仓库记忆文件模板 |
| skills/architect-research/SKILL.md | 研究编排:侦察 → 设计 → 展开 → 验证 → 撰写 |
| skills/architect-research/lanes.md | 侦察块 + 带有已验证端点的来源类别策略库 |
| tests/validate_skills.py | 仓库健全性检查(前言限制、链接、代码块) |
常见问题
我需要 API 密钥吗? 不需要。Claude Code 使用你的 Claude 计划;Codex CLI 使用你的 ChatGPT 计划。
一次运行要花费多少? 构建者/研究员运行会消耗你 ChatGPT 计划的 5 小时和每周配额;一次数小时的运行会占用每周窗口的相当一部分。Fable 的架构师会话只需几分钟,不是数小时。
如果构建者搞坏了东西怎么办? 在架构师的篡改、边界和门控检查通过之前,没有任何内容到达分支——工作树会被丢弃并从冻结提交重新分派。
我可以观察运行吗? 可以——每次分派都会打印构建者模块,你可以将其粘贴到交互式 codex 会话中,使用 /goal 代替。
为什么是两个技能? 研究级展开大约消耗 15 倍聊天级令牌——它应该是一个有意的行为,而不是构建循环的副作用。
许可证
MIT
相似文章
@jumperz:这就是如何将Claude Fable 5作为你的架构师(仅需20美元订阅)加上GPT 5.5 Codex作为你的构建者来运行的方法…完整系统如下…
一位开发者分享了一个工作流程,使用Claude Fable 5作为架构师,GPT 5.5 Codex作为构建者,并配有一个交接记忆系统来高效管理AI辅助开发。
Fable在AI研究活动中被故意大幅削弱
Anthropic在其模型卡中披露,为了阻止加速竞争对手,他们故意降低了Claude在AI研究主题(如预训练流水线和分布式基础设施)上的有效性。研究人员已注意到模型在这些领域表现出的能力下降。
Anthropic 在 fable 5 中构建了一个隐藏开关,使其在构建AI系统方面表现不佳
Anthropic 悄无声息地实施了一些干预措施,限制了 Claude 在构建竞争性AI系统方面的有效性,这些措施通过对一小部分流量进行提示修改和引导向量,作为防止其模型被未经授权用于开发前沿LLM的安全手段。
@uiux_harshit: Claude Fable 可能擅长编码,但设计依然很烂
Claude Fable 5 是 Anthropic 推出的新型 Mythos 级 AI 模型,据称擅长编码,但在设计能力方面仍有欠缺。
@DeRonin_: Claude Fable 5 (MAX) 创造了一个城市,我作为市长指挥1000名平民代理,花费75分钟,324k tokens…
Anthropic 推出了 Claude Fable 5,一款 Mythos 级 AI 模型,用户通过模拟一个拥有1000名代理的城市,在沉浸式3D环境中管理任务和生产力。