我为 Claude Code、Codex 和 Gemini 构建了一个本地 CLI,利用现有的认证机制来互相审查彼此的 GitHub PR
摘要
作者介绍了 `coding-review-agent-loop`,这是一个开源的本地 CLI 工具,它协调多个编码代理(Claude Code、Codex、Gemini)使用现有的本地身份验证相互审查彼此的 GitHub PR,从而避免额外的 API 成本。
我一直在尝试联合使用多个编码智能体(coding agents),但始终面临一个令人头疼的采用障碍:仅为了让一个智能体审查另一个智能体的 PR,就需要处理 API 密钥、CI 密钥以及额外的按 Token 计费。因此,我构建了一个名为 `coding-review-agent-loop` 的开源本地 CLI 工具。它会调用已在本地完成身份验证的 CLI 工具(如 Claude Code、Codex CLI、Gemini CLI 和 `gh`),从而复用你现有的授权和订阅,而无需配置单独的大模型 API 密钥。
示例:
```bash
$ agent-loop task "Fix the flaky auth test" \
--repo OWNER/REPO \
--coder codex \
--reviewer claude \
--reviewer gemini
```
该循环的大致流程如下:
1. 编码智能体(Coder agent)创建或更新一个 GitHub PR。
2. 审查智能体(Reviewer agents)对该 PR 进行审查。
3. 如果审查者发现阻塞性问题,编码智能体会进行修复。
4. 循环重复执行,直到所有审查者均通过。
5. 可选的后续操作可以被总结、提交为 Issue,或返回同一 PR 中进行修复。
这并非旨在取代人类的架构判断。其主要价值在于为代码实现审查提供低成本的本地自动化:包括遗漏的测试、回归问题、代码清理、明显的 Bug,以及强制第二个模型对第一个模型的代码进行批判性审查。
我目前最感兴趣的是“本地优先智能体工作流”这一方向:直接使用人们已经付费使用的 CLI 工具,而无需设置另一套 API/计费通道。
我也在这个仓库本身上进行了“内部测试”(dogfooding):最近的大部分 Issue 和 PR 都是通过该循环创建、审查或迭代完成的。我还在其他一些个人项目中使用了相同的工作流,这也是许多关于后续处理、脏工作树以及 Gemini 输出处理的边缘情况被发现并得到解决的原因。
我希望听到正在使用 Claude Code / Codex / Gemini CLI 的用户的反馈:
- 对于小型 PR,你会信任智能体之间的互审吗?
- 哪些审查模式对你有用?安全审查、架构审查、测试审查?
- 复用本地 CLI 授权对你来说重要吗?还是你更倾向于基于 CI/API 的智能体?
相似文章
Show HN:adamsreview – 为 Claude Code 提供优化的多智能体 PR 审查
介绍 adamsreview,这是一个开源的 Claude Code 插件,它通过采用并行子代理、验证关卡以及自动修复循环的多智能体流水线,能够以更少的误报检测出更多 Bug,从而增强拉取请求(Pull Request)的审查效果。
AI Agent、Claude CLI 和 Linear,协同工作。
作者描述了在 Google Cloud VM 上设置 Claude CLI,当 Linear 工单被标记时自动审查相关代码并提供技术分解说明,从而缩短工单完成时间。他们正在努力实现让 Claude 端到端地创建拉取请求。
Claude Code Ultrareview
Claude Code Ultrareview 利用云端并行 AI 代理集群提供代码审查服务。
我构建了一个本地控制系统,用于处理代理故障、修复、评估和门控,以使类似自动研究的自我改进循环在实际代理代码库中生效
构建了一个本地控制系统来管理代理改进循环,捕获跟踪,发现重复故障,使用Codex/Claude Code起草修复方案,并仅在通过检查和评估后应用更改。
@adrgrondin: 使用Codex CLI和@lmstudio在MacBook Pro M5上本地同时运行子代理以审查代码并查找漏洞……
演示了在MacBook Pro M5上使用Codex CLI和LM Studio(搭载Qwen 3.6,并利用MLX批处理功能)本地运行子代理以进行代码审查和漏洞检测。