@pallavishekhar_: AI Coding Agent SWE - 高层架构 这展示了自主编码代理的主要组成部分以及GitHub…

X AI KOLs Timeline 工具

摘要

一篇详细的帖子,解释了SWE AI编码代理的高层架构,展示了GitHub问题如何通过摄入、编排器、模型网关、工具、代码智能、沙箱环境、PR构建器、护栏和可观测性自主生成拉取请求。

AI Coding Agent SWE - 高层架构 这展示了自主编码代理的主要组成部分,以及GitHub问题如何从已提交的工单一直流转到人工审核的拉取请求。 - GitHub Issue Webhook: 这是运行启动的地方,一个来自开发者的真实GitHub问题,有时是带有堆栈跟踪的详细问题,有时只是一行,比如"登录在移动端崩溃"。 - 摄入与分类: 它接收问题,判断工单是否可操作,并创建一个带有预算的运行,这样我们永远不会无限制地消费。 - 代理编排器: 这是系统的大脑,是自主循环,与模型对话,决定下一步调用哪个工具,应用编辑,运行测试,并反馈结果。 - 模型网关: 模型前的一个薄路由层,这样我们可以将困难的推理发送给强模型,将简单的步骤发送给便宜模型。 - 工具: 这是代理的双手,包括代码搜索、文件读取器、应用差异的文件编辑器,以及构建和运行测试的命令运行器。 - 代码智能: 它构建代码地图和仓库的符号索引,这样代理可以问"这个函数在哪里定义"并得到精确答案,就像开发者使用跳转到定义一样。 - 沙箱环境: 一个隔离的地方,在某个提交处有仓库的新签出,代理在那里构建和运行测试,没有生产访问权限,没有秘密,也没有开放网络。 - PR构建器: 当测试通过且问题修复后,它将最终的差异转换为带有清晰描述的拉取请求,供人工审核。 - 护栏: 它们强制实施硬性限制:成本上限、迭代上限和禁止强制推送规则,这样自主循环不会永远运行或烧钱。 - 可观测性: 它追踪每一次工具调用、每一次模型响应、每一次测试结果以及成本,这样我们可以精确回放代理看到和做了什么。
查看原文
查看缓存全文

缓存时间: 2026/06/20 22:25

AI 编码代理 SWE - 高层架构

本文展示了一个自主编码代理的主要组成部分,以及一个 GitHub 问题如何从提交的工单一直流动到供人类审查的拉取请求。

  • GitHub 问题 webhook:这是运行的起点,来自开发者提交的真实 GitHub 问题,有时是带有堆栈跟踪的详细描述,有时只有一行,比如“移动端登录失败”。

  • 接收与分类:接收问题,判断工单是否可操作,并为运行创建独立的预算,确保不会无限制地支出。

  • 代理协调器:系统的核心,是一个自主循环,负责与模型对话、决定下一步调用哪个工具、应用编辑、运行测试,并将结果反馈回来。

  • 模型网关:位于模型前方的轻量路由层,可以将复杂推理交给强模型处理,简单步骤则交给廉价模型。

  • 工具:代理的双手,包括代码搜索、文件读取器、应用差异的文件编辑器,以及构建和运行测试的命令运行器。

  • 代码智能:为仓库构建代码映射和符号索引,使代理可以询问“这个函数定义在哪里”并得到精确答案,就像开发者使用跳转到定义一样。

  • 沙箱环境:一个隔离的环境,基于仓库的某个提交进行全新签出,代理在其中构建和运行测试,无生产环境访问权限、无密钥、无开放网络。

  • PR 构建器:当测试通过且问题修复后,将最终的差异转换为拉取请求,并附带清晰的描述供人类审查。

  • 安全护栏:强制执行硬性限制,包括成本上限、迭代次数上限,以及禁止强制推送的规则,确保自主循环不会无限运行或浪费资金。

  • 可观测性:追踪每次工具调用、每次模型响应、每次测试结果以及成本,以便我们能够精确回放代理所看到和所做的一切。

  • 注意力机制背后的数学——Q、K、V

  • 注意力机制中 √dk 缩放因子的数学原理

  • 反向传播背后的数学

  • 梯度下降背后的数学

  • 交叉熵损失背后的数学

  • RoPE(旋转位置编码)背后的数学

  • RMSNorm(均方根层归一化)

相似文章