构建了一个AI PR审核工作流,可生成实际修复PR而不仅仅是评论
摘要
作者构建了一个AI驱动的PR审核工作流,可生成实际修复PR而不仅仅是评论,声称比CodeRabbit便宜6倍,且在处理大型PR时更准确。
最近一直在进行vibe coding,并持续遇到GitHub PR的相同问题。手动审核大型PR太麻烦,虽然大多数AI审核工具可以检测问题,但我们最终仍然需要手动修复所有内容。大型多文件PR使情况更糟:\-上下文断裂 \-审核速度慢 \-遗漏问题 \-成本上升
因此我们开始实验自动修复生成,而不仅仅是审核评论。最终构建了一个工作流,它:
* 审查PR中的bug和错误
* 提供高质量提示,我们可以直接复制粘贴给AI代理进行修复
* 自动生成实际修复PR
* 为Cursor/Claude/Copilot等创建问题规划提示
目前一些有趣的结果:
* **比CodeRabbit便宜约6倍**,在处理大型PR时
* 处理大型多文件diff出奇地好,优于coderabbit(coderabbit只能检测出10个bug中的7个,我们**准确检测了10/10**)
* 问题规划比我们预期的要好得多
* 看着它处理一个超过1万行代码的PR,感觉真的疯了😭
仍在实验并改进工作流,特别是在大型仓库上下文处理方面。真诚希望从构建类似代理/代码审核工作流的人那里获得反馈。(由于subreddit规则,链接在评论中)
相似文章
Graphbit PRFlow - AI 代码审查智能助手
Graphbit PRFlow 是一款由 AI 驱动的代码审查智能助手,旨在发现人类审查者或其他工具可能忽略的问题。
@tdinh_me: 刚刚在我的代码库里试了一下,烧了大约 70 美元的 Tokens,结果生成了 30 多个 PR,全都是非关键但完全合法的安全问题……
一名开发者报告称,在代码库上使用 AI 工具时,花费约 70 美元 Tokens 生成了 30 多个真实但非关键的安全修复。
使用 o3、o4-mini 和 GPT-4.1 更快地交付代码
CodeRabbit 推出了基于 OpenAI 的 o3、o4-mini 和 GPT-4.1 模型的增强代码审查功能,使开发者能够提升 4 倍交付速度并减少 50% 的生产 bug。该工具现已包含 VS Code 集成,并使用多步推理来捕捉代码库中的 bug、重构问题和架构缺陷。
Show HN:adamsreview – 为 Claude Code 提供优化的多智能体 PR 审查
介绍 adamsreview,这是一个开源的 Claude Code 插件,它通过采用并行子代理、验证关卡以及自动修复循环的多智能体流水线,能够以更少的误报检测出更多 Bug,从而增强拉取请求(Pull Request)的审查效果。
@LangChain: 这个AI监控自己的代码库,标记缺失的监测器,并自动创建PR修复发现的漏洞。@Shevchenkoaalex 在 @TryR…
一个基于LangChain构建的AI代理持续监控自己的代码库,标记缺失的监测器,并自动创建PR修复发现的漏洞,如Ramp公司的Alex Shevchenko所述。