知即建构:面向智能体记忆的模式约束生成
摘要
银联研究人员提出 SCG-MEM,一种模式约束的生成式记忆架构,通过强制 LLM 仅在动态认知模式内解码有效记忆键,消除结构性幻觉,在 LoCoMo 基准上全面超越稠密检索基线。
arXiv:2604.20117v1 公告类型:新
摘要:建构主义认识论认为知识是被主动建构而非被动复制。尽管大语言模型(LLM)具备生成能力,现有智能体记忆系统仍多基于稠密检索。然而,稠密检索严重依赖句内语义重叠或实体匹配,导致嵌入难以区分语义相似但语境不同的实例,从而引入大量语境不匹配噪声。反之,若直接采用开放式生成访问记忆,则面临“结构性幻觉”风险:模型生成并不存在的记忆键,造成查找失败。受该认识论启发,我们认为记忆由认知模式根本组织,有效回忆必须是在这些模式结构内执行的生成过程。为此,我们提出 SCG-MEM,一种模式约束的生成式记忆架构。SCG-MEM 将记忆访问重构为“模式约束生成”。通过维护动态认知模式,我们严格约束 LLM 解码,仅生成有效记忆条目键,形式化保证杜绝结构性幻觉。为支持长期适应,我们通过同化(将输入 grounded 到现有模式)和调适(用新概念扩展模式)建模记忆更新。此外,我们构建关联图,通过激活传播实现多跳推理。在 LoCoMo 基准上的实验表明,SCG-MEM 在所有类别上均显著优于基于检索的基线。
查看缓存全文
缓存时间: 2026/04/23 10:03
# 知即建构:面向智能体记忆的 Schema 约束生成 来源:https://arxiv.org/html/2604.20117 作者:宋伟男¹、李黛丽¹、杨艳明¹,¹中国银联 邮箱:[email protected]、[email protected]、[email protected]、[email protected] ###### 摘要 建构主义认识论认为,知识是主动建构而非被动复制。尽管大模型(LLM)具备生成能力,现有智能体记忆系统仍依赖稠密检索。然而,稠密检索严重依赖句中语义或实体匹配,导致嵌入无法区分“语义相似但语境不同”的实例,引入大量语境失配噪声。反之,若直接开放生成记忆键,则会出现“结构幻觉”——模型生成不存在的键,造成查找失败。受该认识论启发,我们认为记忆由认知图式(schema)组织,有效回忆必须在此结构内进行生成。为此,提出 SCG-MEM:一种图式约束生成记忆架构。SCG-MEM 将记忆访问重构为“图式约束生成”。通过维护动态认知图式,我们严格限制 LLM 解码,仅生成合法记忆键,形式化杜绝结构幻觉。为支持长期适应,我们用“同化”(将输入纳入已有图式)与“顺应”(用新概念扩展图式)建模记忆更新;并构建“关联图”以激活传播实现多跳推理。在 LoCoMo 基准上的实验表明,SCG-MEM 在所有类别上显著优于检索基线。   ## 1 引言 长期记忆是自主智能体的基础能力,支撑跨多轮交互的连贯推理、个性化与时间一致性。近年 MemGPT、RAG 类系统激增,尽管实现各异,却共同秉持经验主义假设:记忆访问是一个“判别式检索”问题——给定查询,从外部向量库近似相似度召回候选。该范式在短程场景有效,却存在持续缺陷: 1. 稠密检索依赖句中实体,而相同实体常出现在不同语境;语义相似≠语境相关,嵌入难以区分。 2. 检索索引多为平面结构,缺乏多跳关联推理所需的关系拓扑。最新尝试引入图结构,仍依赖稠密检索选入口节点,继承噪声问题。 自然替代方案是将回忆重构为“生成式重建”,利用 LLM 的世界知识与记忆理解能力。然而,直接让 LLM 生成记忆键,常产生不存在的键——即“结构幻觉”,必然导致查找失败。 受皮亚杰建构主义认识论启发,我们主张:人类记忆由认知图式组织,回忆是在既有结构内的重构过程。据此提出 SCG-Mem(Schema-Constrained Generative Memory),把记忆访问从外部检索转变为“图式约束生成”。我们将记忆表示从连续向量转为离散、 grounded 的建构过程:有效回忆被内部认知图式严格限定。 SCG-Mem 三大协同组件: 1. 将原始记忆条目提炼为离散概念(关键词),共同构成智能体的 Cognitive Schema,用动态 Prefix Trie 实现。 2. 回忆时,Trie 作为硬约束限制解码,确保生成键必合法,数学上杜绝结构幻觉。 3. 图式随时间演化:通过“同化”与“顺应”更新 Trie;并叠加 Associative Graph,将离散词表变为可导航的认知地图,支持超越显式查询的关联路径。 LoCoMo 基准实验显示,SCG-Mem 在所有评估类别一致且显著优于检索基线。贡献如下: - 提出 SCG-Mem,首次把检索重构为图式约束生成,用约束解码形式化消除结构幻觉。 - 在 Prefix-Trie 图式上引入 Associative Graph,Trie 保合法性,图保关联推理。 - 设计演化式图式构建机制(同化+顺应),实现稳定且可适应的长期记忆增长。 ## 2 相关工作 ### 2.1 智能体记忆 早期 MemoryBank、MemGPT 用稠密检索或缓存分层管理文本块;ReadAgent 用摘要压缩做交互查找。为支持高层推理,RAPTOR、GraphRAG 将数据组织为递归树或知识图,但多用于静态语料,更新需重建。动态方法如 MemTree、CAML 借鉴皮亚杰树结构在线聚类,却仍依赖判别式检索,易受语义相似但语境无关向量噪声影响。SCG-Mem 首次脱离检索范式,用图式约束解码一次性生成多条合法记忆。 ### 2.2 约束解码 约束解码通过修改推理概率分布满足外部约束。早期确保输出含特定词,后期发展为代码生成中的语法约束(Synchromesh、PICARD)。生成式检索 RetroLLM 用 FM-index 约束生成细粒度证据。近期 GCR、DoG 用约束指导 LLM 在知识图上选节点,但均针对静态图,未考虑图式动态演化。SCG-Mem 把约束机制从语法/静态图扩展到语义与本体领域,用动态 Prefix Trie 实现终身演化的合法记忆路径约束。 ## 3 方法 SCG-Mem(Schema-Constrained Generative Memory)基于建构主义原则:知晓是在约束下的主动建构。与传统把记忆当静态库做相似搜索不同,SCG-Mem 将访问变为受动态认知图式支配的生成过程。 框架三组件(图2): 1. Cognitive Schema(Prefix Trie)定义智能体认识边界,强制合法访问(§3.1&3.2)。 2. Evolutionary Schema Construction 通过同化与顺应动态更新图式,保证长期适应(§3.4)。 3. Associative Graph 在演化图式上叠加关系拓扑,通过激活传播实现多跳推理(§3.5)。 ### 3.1 问题形式化:结构幻觉 在自主智能体中,记忆访问通常建模为从查询语境 c 到记忆键 k 的映射。定义认知图式 S 为合法概念键的有限集合。 **定义 1(结构幻觉)** 给定语境 c 与图式 S,若生成键 k̂ 满足 k̂ ∉ S (即使 k̂ 在世界知识里语义合理),则称 k̂ 为结构幻觉。 **注**:检索系统可能返回不相关但合法键(k̂∈S),而生成模型可产生不存在键,导致查找失败。目标:构建访问机制 Pθ,使得 Pθ(k̂∉S | c) = 0 ### 3.2 认知图式 为实现式 (2) 的合法性约束,我们把认知图式 S 实现为动态 Prefix Trie T。 **定义 2(认知图式)** S 是词表 Σ 上的有限概念键集合:S ⊂ Σ*。 构造 Prefix Trie T,使得根到标记节点的每条路径对应 S 中的一条合法键。生成时,用 T 实时掩码非法 token,确保解码路径必∈S。
相似文章
Memanto:面向长周期智能体的类型化语义记忆与信息论检索
Memanto 引入了一个基于模式(schema)、冲突解决机制以及 Moorcheh 信息论检索引擎的类型化语义记忆系统,在 LongMemEval 和 LoCoMo 基准测试中取得了最先进的结果,且零摄入成本、延迟低于 90 毫秒。
Cognis:面向对话式 AI 智能体的上下文感知记忆系统
Lyzr Cognis 推出统一开源记忆系统,融合 BM25 与 Matryoshka 向量搜索并支持版本感知写入,在 LoCoMo 与 LongMemEval 基准上实现 SOTA。
H-Mem:一种通过混合结构实现智能体记忆演化与检索的新型记忆机制
H-Mem是一种面向基于LLM的智能体的新型记忆机制,采用时间-语义树与知识图谱相结合的混合结构,以建模记忆演化并提升检索性能,在问答基准上实现了最先进水平。
记忆是重构的,而非检索:LLM 代理的图记忆
MRAgent 提出了一种新颖的基于图的记忆框架,能在推理过程中动态重构记忆,在长程基准测试上实现高达 23% 的性能提升,同时降低了计算成本。
@akshay_pachaar: 你的智能体记性很好,但理解力为零。大多数智能体记忆系统都在优化回忆能力。但更难的问题是……
一则关于智能体记忆中模式(Schema)约束重要性的讨论,介绍了 Zep AI 的开源 Graphiti 库,该库用于构建受约束实体和关系类型的时序知识图谱。