我的团队一天内上线了一个能处理技术债务的AI代理。最难的部分不是代码,而是把问题定义得足够清晰,让代理能够接手执行。

Reddit r/AI_Agents 工具

摘要

一个团队构建了AI代理来自动修复技术债务:扫描代码库、自动提交PR。他们发现最困难的是精确定义问题,此外还讨论了多个代理在同一代码库上运行时的冲突问题以及设置防护栏的必要性。

我领导着一个中型公司的团队,我们一直被一个问题困扰:AI帮助我们快速交付,但质量参差不齐——不可扩展的修复、基础性错误、无视我们架构的代码。偷懒的回答是“把提示词写得更好些”,但问题没这么简单。于是,我们没有在每个PR里与这些问题死磕,而是派了一个代理去处理。一个代理,一个北极星目标:自动将技术债务降至零。一条命令扫描整个代码库,选出一笔债务,然后开一个PR。实时仪表盘显示剩余债务。每个PR仍由人工审核和合并,这个环节目前还不能省。有两件事让我意外。第一,工作量的瓶颈不在于token消耗——谁都能烧token——而在于把问题描述上传、精准定义,让代理能够真正理解。这才是当下的真实技能,它把开发者变成了问题工程师,而不是按钮工。第二,在合适的项目上下文内运行,每次修复的成本只有几美分,而非昂贵的模型调用。框架本身比模型更重要——又一次验证了这一点。但我现在真正卡住的是——这也是我发帖的原因。当你对同一个代码库运行不止一个代理时(比如技术债务代理 + 结账代理 + 错误修复代理),它们会在重叠的代码上发生冲突。每个人都说“那就用防护栏”,但在座的没人能说清楚防护栏代理到底是个什么东西、它允许拦截什么。所以,对于那些真正在运行多个代理的团队:你们是如何处理共享代码上的冲突的?你们的防护栏层具体做了什么?
查看原文

相似文章