MEMOREPAIR:智能体记忆中的屏障优先级联修复

arXiv cs.AI 论文

摘要

本文介绍了 MemoRepair,这是一种针对智能体记忆的屏障优先级联修复协议,旨在解决源数据变更时衍生工件过时的问题。实验表明,与穷举修复方法相比,MemoRepair 显著降低了失效记忆的暴露率和修复成本。

arXiv:2605.07242v1 公告类型:新文章 摘要:智能体记忆随着任务演变为持久的衍生工件:摘要、缓存输出、嵌入向量、习得的技能以及可执行的工具流程。当源工件被删除、更正或由于工具/API迁移而失效时,基于该源生成的派生工件可能仍然可见,并利用过时的支持引导未来的行动。我们将这种故障模式形式化为级联更新问题,其中修复目标针对记忆存储中可见的衍生状态。我们提出了 MemoRepair,一种用于智能体记忆的屏障优先级联修复协议。修复事件触发了从失效的派生状态到已验证的后继状态的可控过渡:受影响的派生工件在修复前被撤回,后继工件在当前接口下基于保留的支持和经过阶段性修复的前驱工件构建,且重新发布仅限于已验证的前驱闭合的后继工件。该协议将修复选择问题转化为针对固定修复成本权衡的标量化问题。我们证明,由此产生的发布问题可简化为最大权重前驱闭合问题,并可通过单次 s-t 最小割精确求解。在 ToolBench 和 MemoryArena 上的实验表明,在具有完整影响溯源的情况下,MemoRepair 将无级联修复系统中的失效记忆暴露率从 69.8-94.3% 降低至 0%。与穷举的“全部修复”方法相比,它恢复了 91.1-94.3% 的已验证后继工件,同时将归一化修复操作成本从 1.00 降低至 0.57-0.76。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/11 07:15

# MemoRepair:智能体记忆中的屏障优先级联修复
来源:https://arxiv.org/html/2605.07242
###### 摘要

智能体记忆在任务间演化形成持久的派生工件:摘要、缓存输出、嵌入、习得的技能以及可执行的工具过程。当源工件被删除、修正或因工具或 API 迁移而失效时,由该源派生的后代工件可能仍然可见,并利用过时支持引导未来的行动。我们将这种故障模式形式化为级联更新问题,其中修复目标是记忆存储中可见的派生状态。我们提出了 MemoRepair,一种针对智能体记忆的屏障优先级联修复契约。一次修复事件诱发了从失效后代状态到已验证后继状态的受控过渡:受影响的 descendants 在修复前被撤回,后继者基于保留的支持和在当前接口下分阶段修复的前驱者构建,且重新发布仅限于已验证的前驱闭合后继者。该契约针对固定的修复-成本权衡引发了一个标量化的修复选择问题。我们证明,由此引发的发布问题可归约为最大权前驱闭合问题,并可通过单次 s-t 最小割精确求解。在 ToolBench 和 MemoryArena 上的实验表明,在完整的影响溯源下,与无级联修复的系统相比,MemoRepair 将失效记忆暴露率从 69.8–94.3% 降至 0%。与穷举的“全部修复”相比,它在恢复 91.1–94.3% 的已验证后继者的同时,将归一化的修复操作成本从 1.00 降低至 0.57–0.76。

## 1 引言

持久化记忆已成为跨任务、工具调用和会话运行的智能体 AI 系统的核心基础。在这些系统中,原始交互记录和检索到的文档随着时间的推移被转化为持久的派生工件:先前交互的摘要、缓存的工具输出、可复用的技能,以及将过去经验压缩为智能体可复用状态的可执行工具过程(Park 等人, 2023; Shinn 等人, 2023; Packer 等人, 2024; Xu 等人, 2025)。这些工件通过让智能体基于累积的上下文采取行动,而不是从头重建每个决策,从而支持长时域行为。

随着派生状态的积累,源更新不再仅仅是局部编辑。当源工件被删除、修正或因工具或 API 迁移而失效时,由该源派生的后代可能仍然可见,并继续利用过时支持引导未来的行动。已删除的偏好可能存活于摘要中,已修正的工具响应可能保留在缓存输出中,过时的 API 契约可能持久存在于存储的调用链过程中。我们将此称为**级联更新问题**:根节点更新诱发了对记忆存储中可见后代状态的修复义务。因此,修复目标是智能体记忆中可见的派生状态,而不仅仅是失效的根工件。

先前的工作研究了智能体记忆是如何构建、组织、检索和复用的(Park 等人, 2023; Packer 等人, 2024; Xu 等人, 2025),而工具使用系统使持久痕迹、缓存输出、API 参数和可执行过程成为智能体状态的具体形式(Qin 等人, 2023; Guo 等人, 2024; Patil 等人, 2024)。溯源和依赖追踪方法解释了派生状态如何依赖于源输入(Buneman 等人, 2001; Green 等人, 2007; Cheney 等人, 2009)。目前缺失的是智能体记忆的后更新转换:在失效事件发生后,系统必须决定撤回哪些后代,哪些后继者可以从当前接口下的保留支持中构建,以及哪些已验证的后继者可以重新投入服务。

我们引入了 **MemoRepair**,一种针对智能体记忆的屏障优先修复契约。在删除、修正或迁移后,它首先将受影响的级联从服务中移除,然后基于事后有效的支持、修复后的前驱者以及当前接口构建后继工件。只有其所需前驱者也已被修复的已验证后继者才能重新发布。这产生了一个感知成本的选择问题:在不穷尽修复每个候选者的情况下恢复有用的后继者。对于固定的修复-成本权衡参数 $\lambda$,有效选择形成一个前驱闭合优化问题,我们将其精确归约为单次 s-t 最小割。

在 ToolBench 和 MemoryArena 上的实验涵盖了删除、修正和迁移事件(Qin 等人, 2023; Guo 等人, 2024; He 等人, 2026)。在未感知级联的记忆系统中,92.4–99.7% 的事后行动仍依赖于失效信息,表明普通的更新和检索无法提供级联层面的撤回。在完整的影响溯源下,MemoRepair 反而在修复前撤回受影响的记忆,并仅重新发布已验证的后继者。它在执行大量较少修复工作的同时,保持了与穷举“全部修复”几乎相同的已验证修复。消融实验表明,最小割选择器优于贪婪选择,且存储级修复补充了参数级神经修复。

#### 贡献。

我们做出以下贡献:

- 我们形式化了智能体记忆中的级联更新问题。根节点的删除、修正或迁移诱发了对摘要、缓存输出、提示技能、链过程和神经技能的可见后代状态的修复义务。
- 我们定义了 MemoRepair,一种屏障优先级联修复契约。该契约规定了受影响的后继者离开撤回状态并作为后继者重新进入服务的可见性、支持、依赖和验证条件。
- 我们推导了由该契约引发的修复选择规则。对于固定的修复-成本权衡,有效的重新发布形成一个前驱闭合选择问题,从而为标量化目标提供了精确的 s-t 最小割求解器。

## 2 方法

MemoRepair 中的修复事件是由失效根节点集引发的受影响级联上的屏障优先转换。如图 1 所示,系统首先将级联从服务中撤回,为受影响的后代构建修复候选者,在修复-成本权衡下选择前驱闭合子集,并仅重新发布已验证的后继者。

参见标题图 1:MemoRepair 强制执行的修复转换:受影响的工件被撤回,后继版本被构建,已验证的前驱闭合后继者被重新发布。

### 2.1 问题设置

持久化智能体记忆由有向溯源图表示

$\mathcal{G}=(V,E^{\mathrm{inf}},E^{\mathrm{sem}}),$

其中节点是持久化工件。影响边 $(u,v)\in E^{\mathrm{inf}}$ 表示 $v$ 是使用 $u$ 作为因果支持产生的;这些边决定了修复范围。语义边 $E^{\mathrm{sem}}$ 仅支持检索。每个工件都有一个种类标签

$\mathrm{kind}(x)\in\{\mathsf{record},\mathsf{cache},\mathsf{summary},\mathsf{skill}\},$

每个技能都有一个架构标签

$\mathrm{arch}(x)\in\{\mathsf{neural},\mathsf{prompt},\mathsf{chain}\}.$

修复事件定义为

$e=(F,\tau,\Delta),\quad F\subseteq V,\quad\tau\in\{\mathsf{delete},\mathsf{correct},\mathsf{migrate}\},$

其中 $F$ 是失效根节点集,$\Delta$ 包含修正或迁移信息。受影响的级联仅通过影响边计算:

$C(F)=\mathrm{Reach}(F;E^{\mathrm{inf}}),\quad D(F)=C(F)\setminus F,$

其中 $\mathrm{Reach}$ 包括 $F$ 中的零跳根节点。因此,撤回目标是 $C(F)$,而修复候选者是为后代 $D(F)$ 生成的。

令 $\kappa_e$ 表示事后接口。保留的有效支持为

$\mathsf{Ret}(e)=\begin{cases} V\setminus C(F), & \tau=\mathsf{delete}, \\ (V\setminus C(F))\cup X_{\Delta}, & \tau=\mathsf{correct}, \\ V\setminus C(F), & \tau=\mathsf{migrate}, \end{cases}$

其中 $X_{\Delta}$ 是为修正事件实例化的新鲜替换工件集。因此,$\mathsf{Ret}(e)$ 在事后工件宇宙中解释。

### 2.2 撤回屏障

对于与事件 $e$ 关联的修复计划 $\rho$,MemoRepair 初始化

$B_{\rho}\leftarrow C(F).$

$B_{\rho}$ 中的所有工件在修复期间不可服务。工件 $i$ 的新鲜后继者 $z_i$ 仅当

$\mathrm{Validate}_{i}(z_i)=1.$

验证检查重放一致性用于重新计算,生成时的模式和任务回归行为,链技能的沙箱行为,以及参数修复的遗忘/引用行为。

### 2.3 工件感知候选者构建

$F$ 中的根节点由事件语义处理:删除移除它们,修正提供替换,迁移更新 $\kappa_e$。对于每个后代 $i\in D(F)$,确定性模式映射分配

$\mu_i=\Phi_{\mu}^{e}(i;\mathcal{G},\mathsf{Ret}(e),\kappa_e)\in\{\mathsf{remove},\mathsf{recompute},\mathsf{regen},\mathsf{param}\}.$

可重放的确定性工件被分配 $\mathsf{recompute}$;当保留支持足够时,摘要、提示技能和链过程被分配 $\mathsf{regen}$;当溯源产生遗忘/引用分区时,神经技能被分配 $\mathsf{param}$。否则,工件被分配 $\mathsf{remove}$。

对于每个非移除的后代,

$q_i=(\mu_i,\pi_i,P_i,v_i,w_i,c_i),$

其中 $\pi_i$ 是修复算子,$P_i\subseteq D(F)$ 是被 $\pi_i$ 消耗的其后继者已修复的受影响后代集,$v_i\in\{0,1\}$ 记录可执行性,$w_i,c_i\geq 0$ 是固定的价值-成本项。根替换和接口更新通过 $\mathsf{Ret}(e)$ 和 $\kappa_e$ 提供,而不是通过 $P_i$。

定义非移除候选者索引集

$D^{+}(F)=\{i\in D(F):\mu_i\neq\mathsf{remove}\},\quad Q_{\rho}=\{q_i:i\in D^{+}(F)\}.$

对于每个 $i\in D^{+}(F)$,令

$\bar{P}_i=P_i\cap D^{+}(F).$

如果 $P_i\setminus D^{+}(F)\neq\varnothing$,则 $i$ 需要不可修复的受影响后代,并标记为不可执行($v_i=0$)。修复时依赖图为

$E^{\mathrm{req}}=\{(j,i):i\in D^{+}(F),\,j\in\bar{P}_i\}.$

边 $(j,i)$ 意味着 $j$ 的后继者必须在修复 $i$ 之前分阶段处理。因此,$E^{\mathrm{req}}$ 捕获修复时的先决条件,而非原始溯源。

### 2.4 感知成本的发布选择

对于每个 $i\in D^{+}(F)$,令 $x_i\in\{0,1\}$ 表示 $q_i$ 是否被选中。定义

$\mathrm{Repair}(x)=\sum_{i\in D^{+}(F)}w_ix_i,\quad\mathrm{Cost}(x)=\sum_{i\in D^{+}(F)}c_ix_i.$

对于固定的权衡参数 $\lambda\geq 0$,MemoRepair 求解

$$
\max_{x}\quad\mathrm{Repair}(x)-\lambda\,\mathrm{Cost}(x) \tag{1}
$$

s.t.

$$
x_i\leq v_i,\quad\forall i\in D^{+}(F), \tag{2}
$$

$$
x_i\leq x_j,\quad\forall i\in D^{+}(F),\ \forall j\in\bar{P}_i, \tag{3}
$$

$$
x_i\in\{0,1\},\quad\forall i\in D^{+}(F). \tag{4}
$$

约束 (2) 排除不可执行的候选者,约束 (3) 强制前驱闭合。带有 $\sum_{i\in D^{+}(F)}c_ix_i\leq\beta$ 的硬预算变体在一般情况下是一个前置约束背包问题,因此我们使用固定 $\lambda$ 标量化选择器作为默认发布规则。我们保留 *budget* 用于此可选硬上限 $\beta$;所有主要实验均使用固定 $\lambda$ 选择器,并报告执行计划的归一化修复操作 *Cost*。

###### 定理 1(通过最小割进行标量化修复)。

对于固定事件 $e$,候选族 $Q_{\rho}=\{q_i:i\in D^{+}(F)\}$ 具有固定的 $(P_i,v_i,w_i,c_i)$ 和 $\lambda\geq 0$,标量化修复选择问题 (1)–(4) 可归约为最大权前驱闭合,并可通过单次 s-t 最小割精确求解。

简而言之,设置 $p_i=w_i-\lambda c_i$ 产生最大权闭合问题:正节点连接到源,负节点连接到汇,大容量边强制可执行性和前驱闭合。虽然 $E^{\mathrm{req}}$ 定向从先决条件到依赖项,但最小割网络对每个 $j\in\bar{P}_i$ 使用边 $i\to j$,以便选择 $i$ 强制选择每个所需的前驱者。

算法 1 MemoRepair
输入:修复事件 $e=(F,\tau,\Delta)$,图 $\mathcal{G}$,权衡 $\lambda$
输出:重新发布的已验证后继者 $R_{\rho}$
1: 计算 $\kappa_e$, $C(F)$, $D(F)$, 和 $\mathsf{Ret}(e)$
2: 设置 $B_{\rho}\leftarrow C(F)$ 并撤回 $B_{\rho}$
3: 为 $i\in D(F)$ 分配模式 $\mu_i=\Phi_{\mu}^{e}(i;\mathcal{G},\mathsf{Ret}(e),\kappa_e)$
4: 构建 $D^{+}(F)$, $Q_{\rho}$, $\{\bar{P}_i\}$, 和 $E^{\mathrm{req}}$
5: 将不可用、不可修复或循环的候选者标记为不可执行
6: 求解 (1)–(4) 并设置 $S_{\rho}=\{i:x_i=1\}$
7: 在 $E^{\mathrm{req}}[S_{\rho}]$ 上的拓扑顺序执行 $S_{\rho}$
8: 重新发布已验证的后继者;保持失败者及其依赖者处于撤回状态
9: 返回 $R_{\rho}$

## 3 实验

#### 基准测试。

我们在 ToolBench 和 MemoryArena 上评估 MemoRepair。ToolBench(Qin 等人, 2023),通过 StableToolBench(Guo 等人, 2024)执行。

相似文章

MemEvoBench:LLM 代理内存误演化基准测试

arXiv cs.CL

MemEvoBench 引入了首个用于评估 LLM 代理内存安全性的基准测试,衡量对抗性内存注入、噪声输出和有偏反馈在问答与工作流任务中导致的行为衰退。该研究表明内存演化是安全失败的重要因素,且静态防御措施不足以应对。

知即建构:面向智能体记忆的模式约束生成

arXiv cs.CL

银联研究人员提出 SCG-MEM,一种模式约束的生成式记忆架构,通过强制 LLM 仅在动态认知模式内解码有效记忆键,消除结构性幻觉,在 LoCoMo 基准上全面超越稠密检索基线。

MEME:多实体与动态记忆评估

Hugging Face Daily Papers

MEME 基准测试在多实体和动态变化的条件下评估 AI 记忆系统,揭示了即便采用先进的检索技术,在依赖关系推理方面依然存在显著挑战。