知即建构：面向智能体记忆的模式约束生成

arXiv cs.CL 2026/04/23 04:00 论文

摘要

银联研究人员提出 SCG-MEM，一种模式约束的生成式记忆架构，通过强制 LLM 仅在动态认知模式内解码有效记忆键，消除结构性幻觉，在 LoCoMo 基准上全面超越稠密检索基线。

arXiv:2604.20117v1 公告类型：新摘要：建构主义认识论认为知识是被主动建构而非被动复制。尽管大语言模型（LLM）具备生成能力，现有智能体记忆系统仍多基于稠密检索。然而，稠密检索严重依赖句内语义重叠或实体匹配，导致嵌入难以区分语义相似但语境不同的实例，从而引入大量语境不匹配噪声。反之，若直接采用开放式生成访问记忆，则面临“结构性幻觉”风险：模型生成并不存在的记忆键，造成查找失败。受该认识论启发，我们认为记忆由认知模式根本组织，有效回忆必须是在这些模式结构内执行的生成过程。为此，我们提出 SCG-MEM，一种模式约束的生成式记忆架构。SCG-MEM 将记忆访问重构为“模式约束生成”。通过维护动态认知模式，我们严格约束 LLM 解码，仅生成有效记忆条目键，形式化保证杜绝结构性幻觉。为支持长期适应，我们通过同化（将输入 grounded 到现有模式）和调适（用新概念扩展模式）建模记忆更新。此外，我们构建关联图，通过激活传播实现多跳推理。在 LoCoMo 基准上的实验表明，SCG-MEM 在所有类别上均显著优于基于检索的基线。

查看原文

查看缓存全文

缓存时间: 2026/04/23 10:03

# 知即建构：面向智能体记忆的 Schema 约束生成  
来源：https://arxiv.org/html/2604.20117  
作者：宋伟男¹、李黛丽¹、杨艳明¹，¹中国银联  
邮箱：[email protected]、[email protected]、[email protected]、[email protected]  

###### 摘要  
建构主义认识论认为，知识是主动建构而非被动复制。尽管大模型（LLM）具备生成能力，现有智能体记忆系统仍依赖稠密检索。然而，稠密检索严重依赖句中语义或实体匹配，导致嵌入无法区分“语义相似但语境不同”的实例，引入大量语境失配噪声。反之，若直接开放生成记忆键，则会出现“结构幻觉”——模型生成不存在的键，造成查找失败。受该认识论启发，我们认为记忆由认知图式（schema）组织，有效回忆必须在此结构内进行生成。为此，提出 SCG-MEM：一种图式约束生成记忆架构。SCG-MEM 将记忆访问重构为“图式约束生成”。通过维护动态认知图式，我们严格限制 LLM 解码，仅生成合法记忆键，形式化杜绝结构幻觉。为支持长期适应，我们用“同化”（将输入纳入已有图式）与“顺应”（用新概念扩展图式）建模记忆更新；并构建“关联图”以激活传播实现多跳推理。在 LoCoMo 基准上的实验表明，SCG-MEM 在所有类别上显著优于检索基线。  

![图1：记忆访问范式对比。(a) 稠密检索：将查询与记忆编码为向量，通过相似度取 top-k。结构安全（k∈S）但受语义鸿沟困扰，最近邻可能语境无关。(b) 无约束生成记忆：直接让 LLM 生成记忆键，易出现“结构幻觉”——生成看似合理却不存在的键（如“概念 X”∉S），导致查找失败。(c) SCG-Mem：通过认知图式（Prefix Trie）约束解码，保证生成键必合法（k∈S）。关联图再做多跳遍历，聚合语境相关邻居。](https://arxiv.org/html/2604.20117)  

![图2：SCG-Mem 框架。(A) 演化式图式构建：新对话轮次经双通路处理——“同化”用约束解码将输入归入已有图式节点；“顺应”用自由生成把新概念扩入 Prefix Trie。(B) 关系拓扑构建：同轮共现概念在关联图中连边，边权为累积 IDF 乘积，刻画语义耦合强度。(C) 建构式回忆：给定查询，先通过图式约束解码激活种子概念（保证 k∈S），再在关联图上传播激活，聚合语境相关记忆条目用于生成回复。](https://arxiv.org/html/2604.20117)  

## 1 引言  
长期记忆是自主智能体的基础能力，支撑跨多轮交互的连贯推理、个性化与时间一致性。近年 MemGPT、RAG 类系统激增，尽管实现各异，却共同秉持经验主义假设：记忆访问是一个“判别式检索”问题——给定查询，从外部向量库近似相似度召回候选。该范式在短程场景有效，却存在持续缺陷：  
1. 稠密检索依赖句中实体，而相同实体常出现在不同语境；语义相似≠语境相关，嵌入难以区分。  
2. 检索索引多为平面结构，缺乏多跳关联推理所需的关系拓扑。最新尝试引入图结构，仍依赖稠密检索选入口节点，继承噪声问题。  

自然替代方案是将回忆重构为“生成式重建”，利用 LLM 的世界知识与记忆理解能力。然而，直接让 LLM 生成记忆键，常产生不存在的键——即“结构幻觉”，必然导致查找失败。  

受皮亚杰建构主义认识论启发，我们主张：人类记忆由认知图式组织，回忆是在既有结构内的重构过程。据此提出 SCG-Mem（Schema-Constrained Generative Memory），把记忆访问从外部检索转变为“图式约束生成”。我们将记忆表示从连续向量转为离散、 grounded 的建构过程：有效回忆被内部认知图式严格限定。  

SCG-Mem 三大协同组件：  
1. 将原始记忆条目提炼为离散概念（关键词），共同构成智能体的 Cognitive Schema，用动态 Prefix Trie 实现。  
2. 回忆时，Trie 作为硬约束限制解码，确保生成键必合法，数学上杜绝结构幻觉。  
3. 图式随时间演化：通过“同化”与“顺应”更新 Trie；并叠加 Associative Graph，将离散词表变为可导航的认知地图，支持超越显式查询的关联路径。  

LoCoMo 基准实验显示，SCG-Mem 在所有评估类别一致且显著优于检索基线。贡献如下：  
- 提出 SCG-Mem，首次把检索重构为图式约束生成，用约束解码形式化消除结构幻觉。  
- 在 Prefix-Trie 图式上引入 Associative Graph，Trie 保合法性，图保关联推理。  
- 设计演化式图式构建机制（同化+顺应），实现稳定且可适应的长期记忆增长。  

## 2 相关工作  
### 2.1 智能体记忆  
早期 MemoryBank、MemGPT 用稠密检索或缓存分层管理文本块；ReadAgent 用摘要压缩做交互查找。为支持高层推理，RAPTOR、GraphRAG 将数据组织为递归树或知识图，但多用于静态语料，更新需重建。动态方法如 MemTree、CAML 借鉴皮亚杰树结构在线聚类，却仍依赖判别式检索，易受语义相似但语境无关向量噪声影响。SCG-Mem 首次脱离检索范式，用图式约束解码一次性生成多条合法记忆。  

### 2.2 约束解码  
约束解码通过修改推理概率分布满足外部约束。早期确保输出含特定词，后期发展为代码生成中的语法约束（Synchromesh、PICARD）。生成式检索 RetroLLM 用 FM-index 约束生成细粒度证据。近期 GCR、DoG 用约束指导 LLM 在知识图上选节点，但均针对静态图，未考虑图式动态演化。SCG-Mem 把约束机制从语法/静态图扩展到语义与本体领域，用动态 Prefix Trie 实现终身演化的合法记忆路径约束。  

## 3 方法  
SCG-Mem（Schema-Constrained Generative Memory）基于建构主义原则：知晓是在约束下的主动建构。与传统把记忆当静态库做相似搜索不同，SCG-Mem 将访问变为受动态认知图式支配的生成过程。  

框架三组件（图2）：  
1. Cognitive Schema（Prefix Trie）定义智能体认识边界，强制合法访问（§3.1&3.2）。  
2. Evolutionary Schema Construction 通过同化与顺应动态更新图式，保证长期适应（§3.4）。  
3. Associative Graph 在演化图式上叠加关系拓扑，通过激活传播实现多跳推理（§3.5）。  

### 3.1 问题形式化：结构幻觉  
在自主智能体中，记忆访问通常建模为从查询语境 c 到记忆键 k 的映射。定义认知图式 S 为合法概念键的有限集合。  

**定义 1（结构幻觉）**  
给定语境 c 与图式 S，若生成键 k̂ 满足  
k̂ ∉ S  
（即使 k̂ 在世界知识里语义合理），则称 k̂ 为结构幻觉。  

**注**：检索系统可能返回不相关但合法键（k̂∈S），而生成模型可产生不存在键，导致查找失败。目标：构建访问机制 Pθ，使得  
Pθ(k̂∉S | c) = 0  

### 3.2 认知图式  
为实现式 (2) 的合法性约束，我们把认知图式 S 实现为动态 Prefix Trie T。  

**定义 2（认知图式）**  
S 是词表 Σ 上的有限概念键集合：S ⊂ Σ*。  
构造 Prefix Trie T，使得根到标记节点的每条路径对应 S 中的一条合法键。生成时，用 T 实时掩码非法 token，确保解码路径必∈S。

知即建构：面向智能体记忆的模式约束生成

相似文章

Memanto：面向长周期智能体的类型化语义记忆与信息论检索

Cognis：面向对话式 AI 智能体的上下文感知记忆系统

H-Mem：一种通过混合结构实现智能体记忆演化与检索的新型记忆机制

记忆是重构的，而非检索：LLM 代理的图记忆

@akshay_pachaar: 你的智能体记性很好，但理解力为零。大多数智能体记忆系统都在优化回忆能力。但更难的问题是……

提交意见反馈