从存储到经验:大语言模型智能体记忆机制演进综述
摘要
本综述论文提出了一种大语言模型(LLM)智能体记忆机制的演进框架,将其发展划分为三个阶段:存储、反思和经验。文章分析了长程一致性和持续学习等核心驱动力,旨在为下一代智能体的设计提供指导原则。
查看缓存全文
缓存时间: 2026/05/11 02:42
论文页 - 从存储到体验:大语言模型智能体记忆机制演化综述
来源:https://huggingface.co/papers/2605.06716
摘要
大语言模型智能体的记忆机制经历三个阶段——存储、反思与体验——在一致性、动态环境以及持续学习目标的需求驱动下不断演化。
基于大语言模型(LLM)的智能体通过集成外部工具与规划能力,从根本上重塑了人工智能领域。尽管记忆机制(https://huggingface.co/papers?q=memory%20mechanisms)已成为这些系统的架构基石,但当前研究仍然较为分散,在操作系统工程与认知科学之间摇摆不定。这种理论上的割裂阻碍了对技术融合的统一认知,也缺乏连贯的演化视角。为填补这一空白,本综述提出了一种新颖的演化框架(https://huggingface.co/papers?q=evolutionary%20framework),用于解析大语言模型智能体记忆机制(https://huggingface.co/papers?q=memory%20mechanisms),将发展过程形式化为三个阶段:存储(轨迹保留(https://huggingface.co/papers?q=trajectory%20preservation))、反思(轨迹优化(https://huggingface.co/papers?q=trajectory%20refinement))以及体验(轨迹抽象(https://huggingface.co/papers?q=trajectory%20abstraction))。我们首先正式定义这三个阶段,随后分析推动这一演化的三大核心动力:对长程一致性(https://huggingface.co/papers?q=long-range%20consistency)的必要性、动态环境(https://huggingface.co/papers?q=dynamic%20environments)中的挑战,以及持续学习(https://huggingface.co/papers?q=continual%20learning)的终极目标。此外,我们深入探讨了处于前沿“体验”阶段的两种变革性机制:主动探索(https://huggingface.co/papers?q=proactive%20exploration)与跨轨迹抽象(https://huggingface.co/papers?q=cross-trajectory%20abstraction)。通过综合这些截然不同的视角,本研究为下一代大语言模型智能体的开发提供了稳健的设计原则与清晰的路线图。
查看 arXiv 页面(https://arxiv.org/abs/2605.06716)查看 PDF(https://arxiv.org/pdf/2605.06716)GitHub(https://github.com/FeishuLuo/Evolving-LLM-Agent-Memory-Survey)加入收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.06716)
在智能体中获取此论文:
hf papers read 2605\.06716
还没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
尚无模型链接此论文
请在模型 README.md 中引用 arxiv.org/abs/2605.06716,以便在此页面建立链接。
引用此论文的数据集0
尚无数据集链接此论文
请在数据集 README.md 中引用 arxiv.org/abs/2605.06716,以便在此页面建立链接。
引用此论文的项目空间0
尚无项目空间链接此论文
请在项目空间 README.md 中引用 arxiv.org/abs/2605.06716,以便在此页面建立链接。
包含此论文的合集0
尚无合集包含此论文
将此论文添加至合集(https://huggingface.co/new-collection)以便在此页面建立链接。
相似文章
EvolveMem: 通过AutoResearch实现LLM智能体的自演化记忆架构
EvolveMem为LLM智能体引入了一种自演化记忆架构,通过LLM驱动的诊断和迭代研究周期来优化检索配置,在LoCoMo和MemBench等基准测试上取得了显著的性能提升。
受人类启发的LLM智能体记忆架构
微软研究人员提出了一种受生物学启发的LLM智能体记忆架构,该架构结合了睡眠阶段巩固和基于干扰的遗忘机制,以高效管理持久性记忆。
重新思考自进化大语言模型智能体的持续经验内化
本文研究了大语言模型智能体在多轮迭代经验内化过程中出现能力渐进式崩溃的原因,并提出了一套从经验粒度、注入模式和训练机制三个维度出发的鲁棒解决方案。主要发现包括:原则级经验、逐步注入方式以及离策略上下文蒸馏能够带来更稳定、更可持续的持续学习效果。
STALE:LLM智能体能否识别记忆何时失效?
本文识别了LLM智能体中的一个关键失效模式:当新证据与先前信念冲突时,它们无法更新个性化记忆。本文引入了STALE基准和一个三维探测框架,揭示了即使最佳模型也仅达到55.2%的准确率,并提出了CUPMem作为鲁棒记忆修正的原型。
超越个体智能:基于LLM的多智能体系统中的协作、故障归因与自我进化综述
本综述论文对基于LLM的多智能体系统进行了统一回顾,聚焦于协作、故障归因和自我进化,通过LIFE框架识别开放挑战,并提出跨阶段的研究议程。