@DerekNee: 大家都在讨论代理循环、工具链和自进化代理。但几乎没人讨论实际问题……
摘要
作者认为单一巨型代理无法有效运营公司,并描述了他们在Matrix中的方法,这是一种自主工作操作系统,将代理组织成工作区大脑、部门负责人和带有验证循环的范围限定工作者。
查看缓存全文
缓存时间: 2026/06/25 11:18
每个人都在谈论代理循环、工具链和自我进化的代理。
但几乎没人谈论真正的难点:
你不可能用一个拥有所有工具、所有文件、且没有问责制的巨型代理来运营一家公司。那不是自主性,那是烟雾机。
以下是我们如何在 Matrix 内部构建一个代理公司操作系统的。
技术栈:
工作区脑 → Matrix 运行时协调器 → 部门垂直领域 → 部门主管代理 → 工人代理池 → 验证/签入循环
Matrix 不是聊天机器人。它是一个用于自主工作的操作系统。
工作区脑是公司的边界。
它加载了真正公司运营所需的一切:
→ 产品文档 → 代码库上下文 → 聊天记录、文件、目标 → 运营规则 → 以前的运行记录 + 优秀工作示例 → 审批、记忆、技能
这不是“上下文”。这是共享的操作层。它知道公司知道什么、公司想做什么、谁负责什么、什么算好工作,以及工作完成前必须证明什么。
在它之上是 Matrix 运行时。它协调唤醒、定时任务、部门消息、OKR 状态、权限、工人调度、证明账本、记忆更新。
在运行时之下,工作被组织成部门。
部门不是聊天线程。它是一个长期运行的代理,拥有身份、记忆、技能、目标、历史、工具边界、品味和问责制。
创始人战略。产品工程。增长。运营。研究。
每个部门都有一个主管代理,它决定做什么,读取相关的记忆技能,将工作分解为有范围的任务,并选择合适的执行席位。
有时这个席位是原生 Matrix 工人。 有时是 Codex。 有时是 Claude Code。 有时是浏览器/计算机自动化工人。
关键点不是“一个模型做所有事”。关键点是:
→ 正确的代理 → 正确的上下文 → 正确的边界内 → 使用正确的工具 → 有明确的完成定义
这就是为什么有范围的工人很重要。
一个“做所有事”的代理太模糊了。但是:
→ 一个拥有仓库上下文、测试和审批门的发布工人 → 非常好 → 一个限定于一个补丁和一个验证路径的 Codex 工人 → 非常好 → 一个执行深度仓库分析的 Claude Code 工人 → 非常好 → 一个具有特定流程和验证要求的浏览器工人 → 非常好
窄范围减少漂移。记忆技能防止窄范围代理变得盲目。验证防止快速输出假装成进展。
这就是循环:
工作区脑 → 部门主管 → 工人 → 工件 → 验证 → 签入 → 记忆技能更新
每个循环,公司变得更聪明。这才是真正的自我进化。不是单个代理在虚空中重写自己的提示,而是整个组织通过验证不断累积。
每个工作区都是一个孤立的代理公司。有自己的脑、部门、记忆、工人、证明账本。
工作区在需要时可以相互通信。但默认情况下上下文不应泄露。
隔离不是限制。它是使系统可用的原因。
一旦一个部门模式有效,你就派生这个模式——而不是原始上下文。你仍然会定制记忆、示例、审批门、工具、语气、完成定义。
但你不是从零开始。你已经有这种工作所需操作系统的 70%。
这实际上改变的是:
一个由强操作者组成的小团队现在可以运行以前需要整个部门才能覆盖的领域。
但前提是代理确实优秀。优秀的代理不是来自连接更多工具。它们来自源材料、品味、迭代、窄范围、工作流设计、验证、记忆和人类判断。
模糊的代理只会更快地产生模糊的输出。
Matrix 是我们构建相反事物的尝试:
一个代理公司操作系统,其中自主工作拥有结构、记忆、所有权和验证。
循环就是产品。
代理的注意力和上下文太宝贵了。必须保护它们。
相似文章
@omarsar0:关于「循环工程」趋势,我有很多想法。我花了点时间与我的写作助手一起总结了一些…
讨论AI代理中新兴的「循环工程」趋势,基于与学生们、创始人及初创公司的研究和对话,表明与代理合作的新方式将带来能力上的阶跃式提升。
@yoheinakajima:非常棒的文章,主要聚焦于 coding agents,但个人认为也适用于其他领域。与我之前的许多想法不谋而合:- agent…
该推文总结了构建 agent systems 的关键原则,着重强调了 scaffolding、memory 与可复用工具,内容基于 Yohei Nakajima 的一篇文章。
@akshay_pachaar: Andrej Karpathy:“别让自己成为瓶颈。最大化你的杠杆效应。投入极少的令牌,却能收获巨大的成果……”
对AI代理的循环工程的详细解析:从手动代理监督转向具有触发器、制造器、检查器和持久状态的自主循环。推荐使用Zep的Graphiti进行时序知识图谱,以及Comet的Opik进行可观测性,以构建可靠的无人值守代理系统。
@rohit4verse: 构建可交付的“弱智”AI 循环是目前智能体系统的核心护城河。88% 的代理试点项目采用这种模式,但……
文章讨论了智能体 AI 系统中的常见失败模式,特别是“弱智 AI 循环”,并引用了在 Claude Code 部署中观察到的状态污染和数据泄露等问题。
@techwith_ram: https://x.com/techwith_ram/status/2064925285003542820
探讨了AI编程中从人类在环到自主代理循环的转变,其中代理自我提示并迭代,讨论了减少人类控制的前景与隐藏成本。