@leerob: https://x.com/leerob/status/2065469795529588940
摘要
Cursor AI 描述了其用于扩展 Composer 模型训练的递归代理系统,该系统使用一组自我管理的代理,在出现问题时向人类发出警报。该系统支持并行实验并加速研究,将研究人员的时间视为最稀缺的资源。
查看缓存全文
缓存时间: 2026/06/13 01:04
构建递归代理系统
在Cursor,我们运行着数千个代理来帮助我们训练下一版Composer。
我们会给它们分配研究任务,如果它们未能成功或遇到问题,就会通过Slack给我们发私信,或通过PagerDuty呼我们。
为Composer的训练规模化
我们已经构建了一个代理组织结构图,让它们协同工作。
随着我们为Composer的训练规模化,我们希望并行运行数以千计的实验。这在以前也可以做到,但速度慢且难以跟踪每个实验的状态。为了加快速度并实现并行化,我们构建了一个始终运行的代理系统(没错,它是一个循环)。
一个用于研究的代理系统
系统的工作原理如下:
-
主代理在一台大型远程机器上运行,拥有你在本地使用的所有工具,外加一个磁盘上的文件作为整个集群的“收件箱”。
-
它通过SSH连接运行着数百个子代理的机器,并将它们的状态收集到收件箱中。
-
在每个循环中,它检查集群健康状况,让健康的任务在后台持续运行,并将任何异常情况通过Slack反馈给团队。
-
像所有基础设施一样,代理偶尔会遇到临时问题或需要被“戳一下”,因此主代理可以控制整个集群,根据需要退出或重启进程。
这个“集群管理器”建立在我们之前关于长运行代理的研究基础之上。我们赋予了管理器许多不同的技能,这些技能编码了运行机器学习实验、审查监控结果等方面的隐性知识。
拥有超能力的研究人员
训练一个好模型意味着尝试许多想法来生成有用的强化学习数据。
一台笔记本电脑远远不够,你真正需要的是云中的电脑大军来并行运行实验。而且由于我们不受计算资源限制,我们为机器学习团队的所有人都部署了这套基础设施。
Cursor@cursor_ai·5月19日回复@cursor_ai与SpaceXAI合作,我们正在从头开始训练一个规模更大的模型,总计算量增加了10倍。
借助Colossus 2的百万级H100等效算力以及我们结合的数据和训练技术,我们预计这将是模型能力的一次重大飞跃。894014.8K1.1M
研究人员的时间是我们最稀缺的资源,我们找到了一种方法,将他们的杠杆效应放大数个数量级。想象一下,你有一个管理着10,000名直接下属的人类经理。显然这行不通,但这种“人类→代理”的组织结构却大致可行!
如果你有一个可验证的问题,投入更多token能更快或更好地解决它,那么值得考虑构建这样一个系统。它让我们拥有代理集群,在Composer的数据中爬行,递归地自我改进,为未来版本做准备。
如果这听起来令人兴奋,我们正在招聘!
相似文章
@ericzakariasson: https://x.com/ericzakariasson/status/2062199026544787576
Cursor 推出了调试模式(Debug Mode),该模式允许 AI 代理对代码进行插桩、收集运行时日志,并基于实际证据而非猜测来修复错误,从而提高准确性并处理难以复现的问题。
@Av1dlive:Cursor 每年支付工程师 1,100,000 美元,让他们管理 AI 代理团队,在睡觉时自动交付代码。[Cursor 的 CEO 在 9 分钟内解释了如何使用代理团队实现 100 倍速交付……]
Cursor 每年支付工程师 110 万美元,管理由 AI 代理组成的团队,这些代理能自主完成规划、编码、测试和提交 PR,实现 100 倍速。人类只参与范围界定和审查阶段。
@mikenevermiss: https://x.com/mikenevermiss/status/2066401066518802637
Boris Cherny 等人描述了从提示 AI 代理转向设计持续运行的自主循环,利用内存文件和评估器模式来保证代码质量。
@hwchase17: https://x.com/hwchase17/status/2053157547985834227
文章概述了一个系统的“智能体开发生命周期”(构建、测试、部署、监控),以有效创建和管理 AI 智能体,重点介绍了 LangChain、LangGraph 和 CrewAI 等关键框架。
Mythos 催生 Fable,Cursor 的 Composer 2.5,Agent 构建 Agent
Andrew Ng 讨论了桌面 AI 代理和编码 CLI 工具的兴起,介绍了开源项目 OpenCoworker,并探讨了由 LLM 驱动自主任务执行的 Agent 框架设计。