/advisor 模式: 开源 Python 编码代理,在决策点将廉价工作模型与昂贵审查模型配对(无需支付整个会话的 Opus 费用)
摘要
ClawCodex 是一个开源的 Python 编码代理,实现了 /advisor 模式,在决策点将廉价的工作模型与昂贵的审查模型配对,以降低成本同时保持质量。它支持多个提供商,并在 SWE-bench Verified 上达到 58.2% 的分数。
大多数代理 CLI 都让你只选一个模型——Opus 很出色但烧钱,Haiku 便宜但会错过架构决策。这个 Claude Code 功能被嵌入到一个名为 ClawCodex 的开源项目中的 /advisor 模式,将两者配对。你可以在 GitHub 上搜索它,或查看本帖子后的讨论线程以获取链接。工作原理:一个廉价的工作模型(例如 haiku-4-5 或 deepseek-v4-pro)执行繁重工作——文件读取、编辑、测试运行。在决策点(在做出解释之前、在声明完成之前、卡住时),工作模型暂停并咨询更强的审查模型(例如 opus-4-7)。审查模型查看整个对话——每个工具调用、每个结果——并返回简短的 差距/风险/下一步 建议。然后工作模型继续。在典型会话中,净成本比全程运行 Opus 低数倍,而不会在关键决策上失去架构判断。内部有两种执行模式:\\- 服务器端(Anthropic 1P):advisor beta 头部——一次往返,对提示缓存友好。工作模型和审查模型都在 Anthropic 上。\\- 客户端(任何提供商):工作模型发出常规的 tool\\_use,代理拦截并单独调用配置的审查模型。两次往返,但你可以混合提供商——例如 DeepSeek 工作模型 + Claude Opus 审查模型,或 Gemini 工作模型 + GLM 审查模型。配置在 REPL 中只需一行:/advisor anthropic:claude-opus-4-7 /advisor deepseek:deepseek-v4-pro 状态栏分别显示工作模型令牌、审查模型令牌和美元成本,以便你了解支出去向。它是 Claude Code 的 Python 移植版的一部分,原生支持 Anthropic、OpenAI、Gemini、DeepSeek、GLM、Minimax、OpenRouter。在 SWE-bench Verified 上,该代理在 Gemini 2.5 Pro 上得分为 58.2%,而 openclaude 在同一测试框架下为 53%。真正困难的部分是让审查模型提示停止重复工作模型的计划——早期版本因回音而消耗了工作模型的上下文。修复方法是严格的"不使用第一人称,不重复"规则,加上 差距/风险/下一步 模板。如果有人好奇,我很乐意深入探讨提示设计。源代码链接在下方评论中。
相似文章
Claude Code Ultrareview
Claude Code Ultrareview 利用云端并行 AI 代理集群提供代码审查服务。
编码中90%的枯燥任务基本上已被解决
一位开发者分享使用廉价AI模型(DeepSeek v4、Hunyuan Hy3预览版)自动化90%编码任务的经验,而Opus则用于更难的10%,强调了成本和延迟权衡。
@steipete:人们对我AI支出的反应很抓狂。但没人看到的是:让我如此兴奋地参与OpenClaw的部分原因是……
一位开发者分享了他们如何广泛使用多个Codex AI代理来自动化PR审查、问题去重、安全扫描等OpenClaw项目工作,同时介绍了用于远程代理工作区的工具Crabbox。
Show HN:adamsreview – 为 Claude Code 提供优化的多智能体 PR 审查
介绍 adamsreview,这是一个开源的 Claude Code 插件,它通过采用并行子代理、验证关卡以及自动修复循环的多智能体流水线,能够以更少的误报检测出更多 Bug,从而增强拉取请求(Pull Request)的审查效果。
Codex 应用发布
OpenAI 推出适用于 macOS 的 Codex 应用(于 2026 年 3 月添加 Windows 支持),这是一个桌面界面,用于并行管理多个编码代理、监督长时间运行的任务以及协作软件开发。该应用具有基于项目的线程、支持工作树以实现无冲突的多代理工作、技能扩展,并向 ChatGPT Free/Go 用户开放,付费计划用户享有双倍速率限制。