@augmentcode: https://x.com/augmentcode/status/2066601905598742969
摘要
Augment的Cosmos平台使AI代理能够处理完整的软件开发生命周期,通过自动化常规检查并将人类注意力集中在设计决策上,将代码审查时间从数小时大幅减少到几分钟。
查看缓存全文
缓存时间: 2026/06/16 13:37
智能体现在可以在 Cosmos 中运行完整的 SDLC。那么工程师做什么?
上个月我打开了一个大约 1000 行的 PR。我请来审查的同事看了一眼说:“好的,给我 45 分钟。我现在就做。”
一年前,同一位工程师会说:“这得花六七个小时。我下周二再看。”
这段时间里真正改变的是什么?不仅仅是模型的改进(尽管它们确实进步了)。关键在于 Cosmos,我们统一的智能体平台:一套围绕智能体工程构建的系统,在人工介入之前完成范围界定、任务交接、审查和路由。
编码智能体的天花板
一年前,我的 IDE 和 CLI 已经集成了 AI。我能够快速生成代码,但端到端交付功能的整体产出只提高了大约 40%。
听起来令人失望,但算一笔账就明白了。编码可能只占工作的 30%。其余部分是审查、测试、工单、设计、事件响应和规划。仅仅加快打字速度,吞吐量几乎不变。这就是阿姆达尔定律。
缺失的部分不是另一个编码智能体,而是一个能让智能体共享上下文、记住模式并跨阶段交接工作的系统。
这里以代码审查和事件响应为例,但同样的“围绕智能体的系统”理念几乎适用于所有软件工程任务。
代码审查不再是队列
审查是第一个显现出变化的地方。当代码生成加速后,PR 开始堆积。瓶颈是信心。在团队觉得可以安全合并之前,人类仍然需要推理每一行代码。
解决方案不是“添加一个深度审查步骤”。而是一个工作流,它提取代码审查中机械性的工作,用智能体自动化处理,只把判断性的决策留给人类。实际上,这个系统就是深度代码审查 + 结对评审人:智能体先验证正确性并执行常规修复,然后人类审查员专注于架构、风险和意图。
几周前,我合并了一个 PR,它将两个几乎相同的事件响应专家模板合并为一个。大约一千行改动,很容易出现细微错误。在人类阅读之前,审查工作流就已经开始了。
深度代码审查发现了一个真正的 bug:我删除的一个旧提示文件仍然被已部署的包引用。这会导致实时会话崩溃。
代码审查和事件响应是这里的例子,但同样的“围绕智能体的系统”理念几乎适用于所有软件工程任务。
深度代码审查捕获了一个运行时崩溃;PR 作者在人工审查前修复了它。
深度代码审查捕获了一个运行时崩溃;PR 作者在人工审查前修复了它。
然后 PR 作者在同一线程中修复了它,提交了一个 commit,解释了更改,只留给我一个决定:我是否同意?我同意了。只花了几秒钟,而不是一次上下文切换。
人工审查也发生了变化。我的审查员没有花七个小时阅读删除的行。他们打开了一个结对评审人会话,范围限定在架构和设计上,并用它来回答真正的问题:将这两个专家合并成一个共享模板是正确设计吗?
结对评审人将巨大的 diff 变成了一个聚焦的设计对话,而不是一项阅读任务。
结对评审人将巨大的 diff 变成了一个聚焦的设计对话,而不是一项阅读任务。
目标不是“没有人审查”,而是更好的人工审查。正确性检查、低风险路由和常规修复先由智能体完成。人类则把时间花在设计、风险和系统理解上。
我们已经发布了完整的代码审查数据:大型 PR 的审查时间从六七个降到了 45 分钟,周产出翻了三倍,每个产出单元引入 bug 的提交减少了。自动批准之所以有效,是因为风险分析器很保守。一次假低风险判定比一次不必要的审查代价更大。
值班不再是手动重建上下文
同样的模式也出现在值班中。一旦编码和审查速度加快,运维负载就成了下一个瓶颈。更快的团队会产生更多的告警、更多的部署,以及更多需要值班人员处理的问题。
一年前,调查一个告警大约需要我 30 分钟。我需要在 Slack、PagerDuty、日志、指标、最近部署、最近 PR、负责人和以前的事件之间来回切换。工作并不总是困难,但总是需要注意力。值班时,功能开发基本停滞。
现在,事件调查员在 Slack 内部完成第一遍分析。它收集证据,发布带有建议路径的 RCA,并将事件导向监控、代码修复、回滚或升级。如果代码需要变更,它将修复任务交给 PR 作者,并将结果送入审查。
首次 RCA 时间从大约 30 分钟降至 6 分钟;完整线程解决时间减少了约三分之一。
首次 RCA 时间从大约 30 分钟降至 6 分钟;完整线程解决时间减少了约三分之一。
人类的角色并没有消失。我审查 RCA,提出后续问题,并批准或更改修复路径。智能体收集证据并提出行动建议。我仍然做出生产决策。
最清晰的例子是上周的一条嘈杂告警,一个触发过于频繁的监控器。我的贡献只有一句话:将其调整为每小时一次,并提交一个 PR。智能体启动了变更。代码审查智能体处理了审查。我回去做功能开发了。
事件管理的数据也说明了同样的情况:智能体现在处理 81.3% 的事件,而值班工程师每周合并的 PR 增加了 44%。
平台才是关键
重要的是,代码审查和事件响应不是独立的工具。它们运行在同一个平台上,共享上下文,携带修正信息,并在阶段之间交接工作。审查可以从风险分析到修复再到设计审查。值班时,一条告警可以从 RCA 到修复再到 PR 到审查。工程师不再需要手动拼接各个步骤。
Cosmos 还提供开箱即用的工作流,如代码审查和事件响应(以及许多其他工作流)。智能体驱动机械性的工作,只在需要判断时才引入人类。
这意味着团队可以在一天内采用这些经过实战检验的工作流——包括正确的模型选择、用户体验和护栏——而不是花几个月自己设计系统。
你可以在演示中看到该工作流的概览:https://youtu.be/YqFx8dNgLOI?si=c7w-GVH4mtFw0Xwg
这就是我工作发生变化的地方。智能体接管了机械性工作:读取 diff、追踪日志、重建上下文、编写常规修复、总结证据。剩下的就是判断:架构、风险阈值、RCA 是否足够好、自动批准何时应该扩展、以及当智能体遗漏某些东西时如何改进。
这不是更小的工作。它更重大,因为在人类介入之前,更多的代码和事件已经通过系统流转。
你可以自动化整个 SDLC,就在今天。
如果你运行的是一个相当标准的现代开发栈:常见的工单跟踪器、Git 工作流、CI/CD、可观测性和值班工具等,那么你现在就可以自动化几乎整个 SDLC 生命周期。
有没有粗糙的边角和需要打磨的工作?有。
运行完全定制化流程、自定义基础设施或不寻常约束的团队会遇到更多困难?是的。
智能体工程时代已经到来。这是第一次感觉这条路切实可行。以这种方式构建从未像现在这样可能,也从未像现在这样有趣。
作者:Akshay Utture
Akshay Utture 构建智能体,使软件开发更快、更安全、更可靠。在 Augment Code,他领导公司 AI 代码审查智能体背后的工程工作,将研究级的程序分析与现代生成式 AI 技术结合在一起,自动化 SDLC 中最耗时的部分之一。在加入 Augment 之前,Akshay 在 Uber 工作多年,推进自动化代码审查和修复系统,并在 AWS 自动推理组、Google Android 静态分析团队和 UCLA 进行研究。他的工作处于 AI、软件工程和编程语言理论的交叉点。
相似文章
@augmentcode: https://x.com/augmentcode/status/2047164534310494709
Augment Code 通过其官方 X 账号宣布了一次更新或产品发布,内容可能与其 AI 编程助手相关。
@akshay_pachaar: https://x.com/akshay_pachaar/status/2053166970166772052
The article discusses a shift in AI agent tool usage from the 'MCP vs CLI' debate to 'Code Mode,' where agents write code to dynamically import tools, significantly reducing context window usage. It highlights Anthropic's approach and Cloudflare's implementation, demonstrating a 98.7% reduction in token consumption for specific tasks.
@ashpreetbedi: https://x.com/ashpreetbedi/status/2053885390717890757
Ashpreet Bedi shares a new agent platform designed for auto-improvement, where coding agents like Claude Code can autonomously create, test, and refine other agents using a unified data and API stack.
Claude Code Ultrareview
Claude Code Ultrareview 利用云端并行 AI 代理集群提供代码审查服务。
Cisco 和 OpenAI 用 AI 智能体重新定义企业工程
Cisco 与 OpenAI 合作,将 Codex 从代码补全工具转变为企业级 AI 工程智能体,能够大规模自主执行工作流,显著提升生产力:构建时间缩短 20%,缺陷修复吞吐量提高 10-15 倍。