知即建构:面向智能体记忆的模式约束生成

arXiv cs.CL 论文

摘要

银联研究人员提出 SCG-MEM,一种模式约束的生成式记忆架构,通过强制 LLM 仅在动态认知模式内解码有效记忆键,消除结构性幻觉,在 LoCoMo 基准上全面超越稠密检索基线。

arXiv:2604.20117v1 公告类型:新 摘要:建构主义认识论认为知识是被主动建构而非被动复制。尽管大语言模型(LLM)具备生成能力,现有智能体记忆系统仍多基于稠密检索。然而,稠密检索严重依赖句内语义重叠或实体匹配,导致嵌入难以区分语义相似但语境不同的实例,从而引入大量语境不匹配噪声。反之,若直接采用开放式生成访问记忆,则面临“结构性幻觉”风险:模型生成并不存在的记忆键,造成查找失败。受该认识论启发,我们认为记忆由认知模式根本组织,有效回忆必须是在这些模式结构内执行的生成过程。为此,我们提出 SCG-MEM,一种模式约束的生成式记忆架构。SCG-MEM 将记忆访问重构为“模式约束生成”。通过维护动态认知模式,我们严格约束 LLM 解码,仅生成有效记忆条目键,形式化保证杜绝结构性幻觉。为支持长期适应,我们通过同化(将输入 grounded 到现有模式)和调适(用新概念扩展模式)建模记忆更新。此外,我们构建关联图,通过激活传播实现多跳推理。在 LoCoMo 基准上的实验表明,SCG-MEM 在所有类别上均显著优于基于检索的基线。
查看原文
查看缓存全文

缓存时间: 2026/04/23 10:03

# 知即建构:面向智能体记忆的 Schema 约束生成  
来源:https://arxiv.org/html/2604.20117  
作者:宋伟男¹、李黛丽¹、杨艳明¹,¹中国银联  
邮箱:[email protected][email protected][email protected][email protected]  

###### 摘要  
建构主义认识论认为,知识是主动建构而非被动复制。尽管大模型(LLM)具备生成能力,现有智能体记忆系统仍依赖稠密检索。然而,稠密检索严重依赖句中语义或实体匹配,导致嵌入无法区分“语义相似但语境不同”的实例,引入大量语境失配噪声。反之,若直接开放生成记忆键,则会出现“结构幻觉”——模型生成不存在的键,造成查找失败。受该认识论启发,我们认为记忆由认知图式(schema)组织,有效回忆必须在此结构内进行生成。为此,提出 SCG-MEM:一种图式约束生成记忆架构。SCG-MEM 将记忆访问重构为“图式约束生成”。通过维护动态认知图式,我们严格限制 LLM 解码,仅生成合法记忆键,形式化杜绝结构幻觉。为支持长期适应,我们用“同化”(将输入纳入已有图式)与“顺应”(用新概念扩展图式)建模记忆更新;并构建“关联图”以激活传播实现多跳推理。在 LoCoMo 基准上的实验表明,SCG-MEM 在所有类别上显著优于检索基线。  

![图1:记忆访问范式对比。(a) 稠密检索:将查询与记忆编码为向量,通过相似度取 top-k。结构安全(k∈S)但受语义鸿沟困扰,最近邻可能语境无关。(b) 无约束生成记忆:直接让 LLM 生成记忆键,易出现“结构幻觉”——生成看似合理却不存在的键(如“概念 X”∉S),导致查找失败。(c) SCG-Mem:通过认知图式(Prefix Trie)约束解码,保证生成键必合法(k∈S)。关联图再做多跳遍历,聚合语境相关邻居。](https://arxiv.org/html/2604.20117)  

![图2:SCG-Mem 框架。(A) 演化式图式构建:新对话轮次经双通路处理——“同化”用约束解码将输入归入已有图式节点;“顺应”用自由生成把新概念扩入 Prefix Trie。(B) 关系拓扑构建:同轮共现概念在关联图中连边,边权为累积 IDF 乘积,刻画语义耦合强度。(C) 建构式回忆:给定查询,先通过图式约束解码激活种子概念(保证 k∈S),再在关联图上传播激活,聚合语境相关记忆条目用于生成回复。](https://arxiv.org/html/2604.20117)  

## 1 引言  
长期记忆是自主智能体的基础能力,支撑跨多轮交互的连贯推理、个性化与时间一致性。近年 MemGPT、RAG 类系统激增,尽管实现各异,却共同秉持经验主义假设:记忆访问是一个“判别式检索”问题——给定查询,从外部向量库近似相似度召回候选。该范式在短程场景有效,却存在持续缺陷:  
1. 稠密检索依赖句中实体,而相同实体常出现在不同语境;语义相似≠语境相关,嵌入难以区分。  
2. 检索索引多为平面结构,缺乏多跳关联推理所需的关系拓扑。最新尝试引入图结构,仍依赖稠密检索选入口节点,继承噪声问题。  

自然替代方案是将回忆重构为“生成式重建”,利用 LLM 的世界知识与记忆理解能力。然而,直接让 LLM 生成记忆键,常产生不存在的键——即“结构幻觉”,必然导致查找失败。  

受皮亚杰建构主义认识论启发,我们主张:人类记忆由认知图式组织,回忆是在既有结构内的重构过程。据此提出 SCG-Mem(Schema-Constrained Generative Memory),把记忆访问从外部检索转变为“图式约束生成”。我们将记忆表示从连续向量转为离散、 grounded 的建构过程:有效回忆被内部认知图式严格限定。  

SCG-Mem 三大协同组件:  
1. 将原始记忆条目提炼为离散概念(关键词),共同构成智能体的 Cognitive Schema,用动态 Prefix Trie 实现。  
2. 回忆时,Trie 作为硬约束限制解码,确保生成键必合法,数学上杜绝结构幻觉。  
3. 图式随时间演化:通过“同化”与“顺应”更新 Trie;并叠加 Associative Graph,将离散词表变为可导航的认知地图,支持超越显式查询的关联路径。  

LoCoMo 基准实验显示,SCG-Mem 在所有评估类别一致且显著优于检索基线。贡献如下:  
- 提出 SCG-Mem,首次把检索重构为图式约束生成,用约束解码形式化消除结构幻觉。  
- 在 Prefix-Trie 图式上引入 Associative Graph,Trie 保合法性,图保关联推理。  
- 设计演化式图式构建机制(同化+顺应),实现稳定且可适应的长期记忆增长。  

## 2 相关工作  
### 2.1 智能体记忆  
早期 MemoryBank、MemGPT 用稠密检索或缓存分层管理文本块;ReadAgent 用摘要压缩做交互查找。为支持高层推理,RAPTOR、GraphRAG 将数据组织为递归树或知识图,但多用于静态语料,更新需重建。动态方法如 MemTree、CAML 借鉴皮亚杰树结构在线聚类,却仍依赖判别式检索,易受语义相似但语境无关向量噪声影响。SCG-Mem 首次脱离检索范式,用图式约束解码一次性生成多条合法记忆。  

### 2.2 约束解码  
约束解码通过修改推理概率分布满足外部约束。早期确保输出含特定词,后期发展为代码生成中的语法约束(Synchromesh、PICARD)。生成式检索 RetroLLM 用 FM-index 约束生成细粒度证据。近期 GCR、DoG 用约束指导 LLM 在知识图上选节点,但均针对静态图,未考虑图式动态演化。SCG-Mem 把约束机制从语法/静态图扩展到语义与本体领域,用动态 Prefix Trie 实现终身演化的合法记忆路径约束。  

## 3 方法  
SCG-Mem(Schema-Constrained Generative Memory)基于建构主义原则:知晓是在约束下的主动建构。与传统把记忆当静态库做相似搜索不同,SCG-Mem 将访问变为受动态认知图式支配的生成过程。  

框架三组件(图2):  
1. Cognitive Schema(Prefix Trie)定义智能体认识边界,强制合法访问(§3.1&3.2)。  
2. Evolutionary Schema Construction 通过同化与顺应动态更新图式,保证长期适应(§3.4)。  
3. Associative Graph 在演化图式上叠加关系拓扑,通过激活传播实现多跳推理(§3.5)。  

### 3.1 问题形式化:结构幻觉  
在自主智能体中,记忆访问通常建模为从查询语境 c 到记忆键 k 的映射。定义认知图式 S 为合法概念键的有限集合。  

**定义 1(结构幻觉)**  
给定语境 c 与图式 S,若生成键 k̂ 满足  
k̂ ∉ S  
(即使 k̂ 在世界知识里语义合理),则称 k̂ 为结构幻觉。  

**注**:检索系统可能返回不相关但合法键(k̂∈S),而生成模型可产生不存在键,导致查找失败。目标:构建访问机制 Pθ,使得  
Pθ(k̂∉S | c) = 0  

### 3.2 认知图式  
为实现式 (2) 的合法性约束,我们把认知图式 S 实现为动态 Prefix Trie T。  

**定义 2(认知图式)**  
S 是词表 Σ 上的有限概念键集合:S ⊂ Σ*。  
构造 Prefix Trie T,使得根到标记节点的每条路径对应 S 中的一条合法键。生成时,用 T 实时掩码非法 token,确保解码路径必∈S。

相似文章