从存储到经验:大语言模型智能体记忆机制演进综述

Hugging Face Daily Papers 论文

摘要

本综述论文提出了一种大语言模型(LLM)智能体记忆机制的演进框架,将其发展划分为三个阶段:存储、反思和经验。文章分析了长程一致性和持续学习等核心驱动力,旨在为下一代智能体的设计提供指导原则。

基于大语言模型(LLM)的智能体通过整合外部工具和规划能力,从根本上重塑了人工智能领域。尽管记忆机制已成为这些系统的架构基石,但当前的研究仍处于碎片化状态,在操作系统工程与认知科学之间摇摆不定。这种理论上的分歧阻碍了对技术融合的统一理解以及连贯的演进视角。为了弥合这一差距,本综述提出了一种新颖的大语言模型智能体记忆机制演进框架,将发展过程形式化为三个阶段:存储(轨迹保存)、反思(轨迹优化)和经验(轨迹抽象)。我们首先对这三个阶段进行形式化定义,随后分析推动这一演进的三大核心驱动力:长程一致性的必要性、动态环境中的挑战以及持续学习的最终目标。此外,我们还特别探讨了处于前沿经验阶段的两种变革性机制:主动探索与跨轨迹抽象。通过综合这些不同的观点,本研究为下一代大语言模型智能体的开发提供了稳健的设计原则和清晰的路线图。
查看原文
查看缓存全文

缓存时间: 2026/05/11 02:42

论文页 - 从存储到体验:大语言模型智能体记忆机制演化综述

来源:https://huggingface.co/papers/2605.06716

摘要

大语言模型智能体的记忆机制经历三个阶段——存储、反思与体验——在一致性、动态环境以及持续学习目标的需求驱动下不断演化。

基于大语言模型(LLM)的智能体通过集成外部工具与规划能力,从根本上重塑了人工智能领域。尽管记忆机制(https://huggingface.co/papers?q=memory%20mechanisms)已成为这些系统的架构基石,但当前研究仍然较为分散,在操作系统工程与认知科学之间摇摆不定。这种理论上的割裂阻碍了对技术融合的统一认知,也缺乏连贯的演化视角。为填补这一空白,本综述提出了一种新颖的演化框架(https://huggingface.co/papers?q=evolutionary%20framework),用于解析大语言模型智能体记忆机制(https://huggingface.co/papers?q=memory%20mechanisms),将发展过程形式化为三个阶段:存储(轨迹保留(https://huggingface.co/papers?q=trajectory%20preservation))、反思(轨迹优化(https://huggingface.co/papers?q=trajectory%20refinement))以及体验(轨迹抽象(https://huggingface.co/papers?q=trajectory%20abstraction))。我们首先正式定义这三个阶段,随后分析推动这一演化的三大核心动力:对长程一致性(https://huggingface.co/papers?q=long-range%20consistency)的必要性、动态环境(https://huggingface.co/papers?q=dynamic%20environments)中的挑战,以及持续学习(https://huggingface.co/papers?q=continual%20learning)的终极目标。此外,我们深入探讨了处于前沿“体验”阶段的两种变革性机制:主动探索(https://huggingface.co/papers?q=proactive%20exploration)与跨轨迹抽象(https://huggingface.co/papers?q=cross-trajectory%20abstraction)。通过综合这些截然不同的视角,本研究为下一代大语言模型智能体的开发提供了稳健的设计原则与清晰的路线图。

查看 arXiv 页面(https://arxiv.org/abs/2605.06716)查看 PDF(https://arxiv.org/pdf/2605.06716)GitHub(https://github.com/FeishuLuo/Evolving-LLM-Agent-Memory-Survey)加入收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.06716)

在智能体中获取此论文:

hf papers read 2605\.06716

还没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

尚无模型链接此论文

请在模型 README.md 中引用 arxiv.org/abs/2605.06716,以便在此页面建立链接。

引用此论文的数据集0

尚无数据集链接此论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.06716,以便在此页面建立链接。

引用此论文的项目空间0

尚无项目空间链接此论文

请在项目空间 README.md 中引用 arxiv.org/abs/2605.06716,以便在此页面建立链接。

包含此论文的合集0

尚无合集包含此论文

将此论文添加至合集(https://huggingface.co/new-collection)以便在此页面建立链接。

相似文章

受人类启发的LLM智能体记忆架构

arXiv cs.AI

微软研究人员提出了一种受生物学启发的LLM智能体记忆架构,该架构结合了睡眠阶段巩固和基于干扰的遗忘机制,以高效管理持久性记忆。

重新思考自进化大语言模型智能体的持续经验内化

arXiv cs.CL

本文研究了大语言模型智能体在多轮迭代经验内化过程中出现能力渐进式崩溃的原因,并提出了一套从经验粒度、注入模式和训练机制三个维度出发的鲁棒解决方案。主要发现包括:原则级经验、逐步注入方式以及离策略上下文蒸馏能够带来更稳定、更可持续的持续学习效果。

STALE:LLM智能体能否识别记忆何时失效?

Hugging Face Daily Papers

本文识别了LLM智能体中的一个关键失效模式:当新证据与先前信念冲突时,它们无法更新个性化记忆。本文引入了STALE基准和一个三维探测框架,揭示了即使最佳模型也仅达到55.2%的准确率,并提出了CUPMem作为鲁棒记忆修正的原型。