我如何让Claude Code和Codex在数周内持续追求目标
摘要
作者构建了SmithersBot,这是一个开源代理框架,通过将计划分解为任务、要求审批以及使用检查点来避免退化,协调Claude Code和Codex在数周内追求长期目标。
Claude Code和Codex在单项任务上表现出色,但完成后就会停止。你给它们一个大任务,它们运行一段时间,完成该会话中能做的事,然后你又得自己决定下一步。我意识到你无法一次性规划一个长期目标。代理必须持续运行,并在观察环境的同时更新其计划。这正是阻碍其他代理框架(如OpenClaw或Hermes)实现长期目标的原因。于是我构建了SmithersBot来持续运行。你通过Telegram向它发送一个目标,它会将其转化为一个你批准的计划,然后逐个任务地执行。当一个计划完成后,它会提出下一个计划,并在数天、数周或数月内持续追求更大的目标。它会一直运行直到一个观察点;此时要么需要人类判断来指导后续工作,要么需要时间流逝来观察代理工作的结果。**我如何让代理在不放弃控制的情况下持续运行:** * 它提前向我询问关键决策并推荐答案,这样它就不会胡乱猜测我的意图。* 每个任务都在一个全新的工作器中运行,因此长时间的会话不会退化。* 它在每个任务前进行git检查点,以便不良步骤可以被撤销或回滚。* 构建和测试检查在工作器外部运行,因此它无法在未通过时告诉我通过了。* 如果一个任务被阻塞,它会继续处理那些不依赖于它的任务。* 每个操作和工具调用都写入磁盘,这样代理和我都能确切看到发生了什么。我一直在用它来改进自身,它的下一个目标是建立并运营自己的公司。它是开源的且免费。你希望你的代理在数周内追求什么样的长期目标?
相似文章
@ClaudeDevs: 如何确保 Claude 坚持工作直到任务完成?Claude Code 通过几种方式来实现这一点,其中包括我们最近推出的功能…
Anthropic 的 Claude Code 引入了 /goal 命令,以帮助 AI 代理持续运行并完成任务,直到工作完全结束。
我如何不再监控Claude Code和Codex长达数小时的运行:规划、Git检查点以及代理外部的测试闸门
作者分享了在长时间、多步骤任务中运行Claude Code和Codex无需持续监控的技巧,使用外部测试闸门、每个任务的Git检查点以及基于DAG的计划,避免阻塞任务导致整个运行停滞,并将这些方法打包成一个开源工具。
@Saboo_Shubham_: Codex 负责构建,Claude Code 负责审查与优化,Hermes 负责协调与交接。这一切……
演示了一个多智能体工作流:Codex 构建代码,Claude Code 进行审查,Hermes 管理协调工作,所有流程均通过看板(Kanban)进行跟踪。
@Saboo_Shubham_: 事态发展变得非常疯狂。在 Codex 之后,Claude Code 刚刚发布了 /goal 功能。我现在可以使用 Hermes Agent 作为协调……
Hermes Agent 已更新为可充当 Claude Code 和 Codex 的协调器,允许用户通过统一的看板追踪进度。
@RoundtableSpace:Codex 负责构建,Claude Code 负责审查,Hermes 协调交接。三个智能体,一个看板,无需等待……
介绍了一个由三个 AI 智能体(Codex、Claude Code 和 Hermes)自主协作的看板工作流,无需人类等待。