Codex CLI 一直说“完成了”,但实际没有。所以我让它证明自己。

Reddit r/AI_Agents 工具

摘要

Botpipe 是一个框架,为 Codex CLI 及类似代理添加结构化流程(SOP),用可验证的步骤取代不可靠的“完成”状态,旨在扩展智能编码,不再需要人类充当调度和测试角色。

Codex CLI 可以编写代码。问题是,“写了代码”和“完成任务”不是一回事。 Codex: 完成 我: 运行测试 Codex: 已修复 我: 审查 Codex: 发现差距 Codex: 你说得对,我会调整 Codex: 完成 我: 你确定吗? Codex: 实际上…… 这种模式有趣20分钟,然后就成了一项普通工作。所以我构建了 Botpipe。 Botpipe 是一个框架,用于轻松创建围绕 Codex CLI 和其他智能代理提供商的“适配层”。其理念是:真正的代理工作应该更像 SOP,而不是聊天。 一个流程包含: 任务 计划 路径 验证 重试 日志 检查点 策略 真正的“完成”定义 与其相信“完成”,Botpipe 让代理通过以下路径: 实现 -> 验证 -> 已接受 或: 实现 -> 验证 -> 需要修改 -> 实现 如今大多数智能编码仍然把人类当作调度员、测试员、审查员、记录员和安全层。这无法扩展。下一层不是更好的提示词,而是适配层。
查看原文

相似文章

@jxnlco: https://x.com/jxnlco/status/2057153744630890620

X AI KOLs Following

这个推文串讨论了使用Codex编码代理的最佳实践,重点包括持久线程、语音输入、引导、队列,以及其从代码生成扩展到完整计算机工作流程自动化的能力。

解析Codex代理循环

OpenAI Blog

# 解析Codex代理循环 来源:[https://openai.com/index/unrolling-the-codex-agent-loop/](https://openai.com/index/unrolling-the-codex-agent-loop/) [Codex CLI⁠\\(在新窗口中打开\\)](https://developers.openai.com/codex/cli)是我们的跨平台本地软件代理,旨在在你的机器上安全高效地运行,生成高质量、可靠的软件更改。自从我们首次推出以来,我们已经学到了大量关于如何构建世界一流软件代理的知识[自从我们首次启动