构建了一个AI PR审核工作流,可生成实际修复PR而不仅仅是评论
摘要
作者构建了一个AI驱动的PR审核工作流,可生成实际修复PR而不仅仅是评论,声称比CodeRabbit便宜6倍,且在处理大型PR时更准确。
最近一直在进行vibe coding,并持续遇到GitHub PR的相同问题。手动审核大型PR太麻烦,虽然大多数AI审核工具可以检测问题,但我们最终仍然需要手动修复所有内容。大型多文件PR使情况更糟:\-上下文断裂 \-审核速度慢 \-遗漏问题 \-成本上升
因此我们开始实验自动修复生成,而不仅仅是审核评论。最终构建了一个工作流,它:
* 审查PR中的bug和错误
* 提供高质量提示,我们可以直接复制粘贴给AI代理进行修复
* 自动生成实际修复PR
* 为Cursor/Claude/Copilot等创建问题规划提示
目前一些有趣的结果:
* **比CodeRabbit便宜约6倍**,在处理大型PR时
* 处理大型多文件diff出奇地好,优于coderabbit(coderabbit只能检测出10个bug中的7个,我们**准确检测了10/10**)
* 问题规划比我们预期的要好得多
* 看着它处理一个超过1万行代码的PR,感觉真的疯了😭
仍在实验并改进工作流,特别是在大型仓库上下文处理方面。真诚希望从构建类似代理/代码审核工作流的人那里获得反馈。(由于subreddit规则,链接在评论中)
相似文章
使用开源模型构建了价格仅为 CodeRabbit 六分之一的替代方案
使用开源模型构建了比 CodeRabbit 更便宜的替代方案,以六分之一的成本实现了相似或更好的 PR 审查准确性,并具备自动修复和基于提示的 bug 修复等功能。
Graphbit PRFlow - AI 代码审查智能助手
Graphbit PRFlow 是一款由 AI 驱动的代码审查智能助手,旨在发现人类审查者或其他工具可能忽略的问题。
Open Code Review – 一款由 AI 驱动的代码审查 CLI 工具
阿里巴巴已将 Open Code Review 开源,这是一款由 AI 驱动的代码审查 CLI 工具,将确定性工程方法与 LLM 智能体能力相结合。该工具最初作为内部工具使用,服务于数万名开发者,已识别出数百万处缺陷。它通过读取 Git diff 输出,利用可配置的模型端点生成结构化的行级审查意见。
每在AI编码工具上花费1美元,只有0.18美元能进入生产环境。我们分析了超过100万个PR,以找出其余资金的去向。
根据对超过100万个拉取请求的研究发现,每在AI编码工具上花费1美元,只有0.18美元能进入生产环境,其余资金用于修复错误、返工和代码审查。分析显示,虽然PR数量增长了2.6倍,但被撤回的PR增长了3.7倍,表明失败比产出增长得更快。
@cursor_ai: 开发者正在使用AI代理编写更多的“mega PRs”。
开发者越来越多地使用AI代理生成更大的拉取请求,即“mega PRs”。