上下文是共享的,承诺不是。
摘要
本文认为,AI 代理协调失败源于缺少承诺记录,而非缺少上下文,并提出了一个带有类型状态(Proposed、Active、Amended、Superseded)的共享决策账本,用于持久记录决策并改善多代理协调。
每个人都在谈论上下文管理。RAG 管道、记忆系统、知识图谱、长上下文窗口。推动大部分工作的问题是:如何给代理足够的信息来很好地行动?这是个正确的问题。但上下文不是承诺。问题不在于信息,而在于基于上下文做出的决策没有持久的形式。它们作为行动存在,而非记录。
---
## 仅有事实仍不够
标准的回应是更好的记忆:存储更多、检索更好、让代理保持信息同步。这有帮助。但仅凭事实并不能解决协调问题,因为协调失败不是由信息缺失造成的,而是由决策缺失造成的。事实是静态的:这是我们知道的。决策是关系型的:基于这些数据,有人选择了这个方向。它有基础、作者和后果。与事实不同,决策可以被重新审视、改进或替换。随之而来的失败是显而易见的。代理重新推导已经做出的决策。两个代理从相同的原始材料中做出矛盾的判断。一个代理覆盖了先前的方向,却没有留下任何更改内容或原因的痕迹。这些都不是记忆失败。它们是承诺失败:系统没有持久记录什么已被采纳、由谁采纳、在什么范围内采纳,或者当它变化时下游会破坏什么。四个不同的事情出错。代理对已承诺的内容持有不同看法。一个计划存在,但没有人知道它是否已被采纳。不清楚谁可以修改或替代先前的判断。后来的参与者无法重建为什么选择了某件事或它影响什么。上下文管理有助于第一个问题。它没有解决其他三个。缺少的不是更多的上下文。而是一个共享的承诺账本:一个持久的记录,记录了什么已被承诺、由谁、在什么范围内,以及什么依赖于它。解决方案是让决策成为该账本的承载单元。黑板架构、DMN 和最近的写端内存裁定工作已经探索了相关问题。Rosen 和 Rosen 2026年5月关于持久中间工件的预印本是最接近的公开表述。他们的框架广泛关注工件;我们的框架专注于决策作为具体的协调原语,即规范层,用于管理代理行为,而不仅仅是保存代理工作成果。我们描述的是一个具有 MCP 原生协调和类型状态的实际实现。并非声称发明了底层见解。
---
## 决策状态作为代理信号
一个决策值得捕获的条件是它约束未来的代理行为或承诺方向。不是每个微小的选择。稀疏性是一个特性。臃肿的决策层是官僚废气,而不是协调。决策是一个类型化记录。它包含:推导出它的具体数据和上下文、作者(人类或代理)和一个状态。状态不是管理性的。它是向每个遇到它的代理发出的精确信号。
| 状态 | 对代理的信号 |
|---|---|
| Proposed | 已经有人在处理这个。请勿重复推理。 |
| Active | 活跃约束。在此范围内工作。 |
| Amended | 仍然有效,但已完善。阅读修订以获取完整情况。 |
| Superseded | 不再有效。追溯至替代它的内容及原因。 |
> 这四种状态是工作词汇,并非完整的生命周期模型。在完整实现中,修订最好建模为谱系关系。一个决策可以同时处于 Active 和 Amended 状态。该表格反映了代理应如何解读信号;架构是另一个话题。“Amended”和“Superseded”不是同义词。它们传达不同的意思。已修订(Amended)的决策意味着意图仍然成立,但实现或框架中某些具体内容已发生变化。代理应将原始决策和修订一起阅读。旧决策没有错,它只是被完善了。被替代(Superseded)的决策意味着根本性的东西已经改变。意图不再成立。旧决策现在只有历史意义。代理应向前追溯替代它的内容,而不是试图调和两者。这种区别对群体有实际影响。遇到已修订决策的代理知道要将两者结合以获取当前图景。遇到被替代决策的代理知道停下来,寻找下一步。决策之间的关系可以从简单的引用开始:一个标识符、一个链接、一个命名来源。这足以开始。使模型可扩展的是维护反向索引的后端:给定这个文档,什么依赖于它?这是使后续两个能力成为可能的基础设施。并非所有边都有相同权重。断言边(Asserted edges)在决策创建或消费时显式声明。它们驱动执行和影响预览。推断边(Inferred edges)源自代理推理、轨迹或自然语言。它们驱动警告和审查请求,从不硬性无效化。将两者等同对待是反向依赖系统崩溃的地方。
---
## 作者掌握主线
在这个模型中,AI 工作以自然语言进行。决策不是模式条目或状态标志。它是一个书面陈述:基于特定上下文,可读作文本,对下一个需要了解承诺内容及其原因的代理或人类来说是可读的。人类扮演作者的角色。不是审批者,不是监控者。是作者。是那个人,他掌握跨会话、跨代理以及它们之间间隙的叙事主线。当新代理启动时,它读取之前的内容并在此基础上构建。工作具有连续性,因为有一个声音将其向前推进。在实践中,这意味着一个路由和所有权系统:明确的角色、定义的升级标准和风险分级批准。外观变化自动批准。孤立变更需要快速签字。行为或跨领域变更需要全面审查。分类不是自动判断。它是团队预先定义的规则。作者的角色不是管理每个代理行动。而是维护共享的承诺账本:提议、批准、完善、替代。并持续检查。不是一次性设置。而是持续的过程工程。这是一种新型工作。不是作为阶段的架构审查。而是以代理执行速度进行创作。持续的过程优化。
---
## 决策层的持续集成
安排一个代理定期遍历活动决策树。对于每个活跃或已修订的决策:其依据的数据是否仍然最新?是否有任何变化会改变这个判断?标记出已经漂移的内容。在下一次代理遇到过时期限之前,将其呈现给作者。这就是决策层的持续集成。代理进行扫描。群体不会遇到过时的依据。并非每个信号都要进入人工审查。低影响漂移由 CI 代理本身处理:重新验证、重新索引、更新置信度标记。结构性变化会升级:破坏兼容性、替代活跃决策、显著的范围变化。将每个依赖变化都路由到人的 CI 不是 CI,而是官僚废气。扫描不必等待计划。当源文档状态改变时,依赖它的决策可以立即收到信号。作者在下次代理运行遇到过时期限之前就能看到依赖断裂。定期检查捕获逐渐漂移。反应性信号捕获发生的那一刻。该模型也反向工作。在作者更改或移除源材料之前,系统可以呈现所有依赖它的内容。更改此文档会影响这八个决策。归档此项将标记三个活跃约束供审查。这是影响预览:不是事后标记,而是行动前信号。作者在完全了解下游后果的情况下行动。
---
## 过程即状态
大多数系统将过程和内容视为独立关注点。一层治理
相似文章
过期上下文:一种奇怪的新型协调错误
文章讨论了AI代理系统中过期上下文的问题,即代理基于过时信息做出决策,并提出了一个包含版本控制和存在信号的协调原语,以防止冲突和浪费令牌。
Context:通过可组合沙箱程序、声明式布线及结构化交互实现主动目标导向智能
本文介绍了Context——一种替代反应式聊天机器人的主动目标导向智能体新架构。通过可组合沙箱程序、声明式布线和主动状态机,本文给出了证明效率提升的形式化定理,并提供了开源实现。
链式上下文系统
讨论在基于循环的AI代理中管理上下文的方法,比较保存与不保存内部推理步骤之间的权衡,以避免冗余和重复。
我在尝试为不同会话中的不同代理确保上下文连续性中学到的东西
作者介绍了 AICTX,一个开源工具,它能在编码代理会话之间保留结构化的操作状态,从而减少代理每次重新发现仓库上下文的需求。
Agent Context
Agent Context 是一款开发者工具,可让用户将参考项目附加到 AI 编程助手。