从RAG到记忆:大型语言模型的非参数持续学习
摘要
HippoRAG 2通过更深入的段落整合和更有效的LLM使用改进了RAG,在事实性、意义构建和联想记忆任务上全面优于标准RAG,实现了非参数持续学习。
查看缓存全文
缓存时间: 2026/06/18 23:42
论文页面 - 从RAG到记忆:大语言模型的非参数持续学习
来源:https://huggingface.co/papers/2502.14802 发布日期:2025年2月20日
摘要
HippoRAG 2 通过整合段落信息并利用更有效的 LLM 来增强 RAG,在事实性、意义构建和联想记忆任务上均提升了性能。
我们持续获取、组织和利用知识的能力是人类智能的一个关键特征,AI 系统必须接近这一点才能释放其全部潜力。鉴于大语言模型(LLM)在持续学习中面临的挑战,检索增强生成(RAG)已成为引入新信息的主要方式。然而,其对向量检索的依赖阻碍了其模仿人类长期记忆动态且相互关联本质的能力。近期的 RAG 方法通过利用知识图谱等结构来增强向量嵌入,以解决部分不足,即意义构建和联想性。但它们在更基础的事实性记忆任务上的性能却明显低于标准 RAG。我们针对这一非预期的退化进行了改进,并提出了 HippoRAG 2 框架,该框架在事实性、意义构建和联想记忆任务上全面超越了标准 RAG。HippoRAG 2 基于 HippoRAG 中使用的 Personalized PageRank 算法,并通过更深入的段落整合以及更有效地在线使用 LLM 来增强。这种组合使该 RAG 系统更接近人类长期记忆的效果,在联想记忆任务上比最先进的嵌入模型提升了 7%,同时展现出更优的事实性知识和意义构建记忆能力。这项工作为 LLM 的非参数持续学习铺平了道路。我们的代码和数据将在 https://github.com/OSU-NLP-Group/HippoRAG 上发布。
查看 arXiv 页面 (https://arxiv.org/abs/2502.14802)
查看 PDF (https://arxiv.org/pdf/2502.14802)
GitHub 3.69k auto (https://github.com/OSU-NLP-Group/HippoRAG)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2502.14802)
在你的 Agent 中获取这篇论文:
hf papers read 2502.14802
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型 1
muthuk1/graphrag-inference-hackathon (https://huggingface.co/muthuk1/graphrag-inference-hackathon)
引用该论文的数据集 2
osunlp/HippoRAG_2 预览 • 更新于 2025年4月2日 • 410 • 9 (https://huggingface.co/datasets/osunlp/HippoRAG_2)
g7haha/HippoRAG_2 预览 • 更新于 5月6日 • 36 (https://huggingface.co/datasets/g7haha/HippoRAG_2)
引用该论文的 Spaces 0
没有链接此论文的 Space
在 Space 的 README.md 中引用 arxiv.org/abs/2502.14802 即可链接到此页面。
包含该论文的收藏集 12
浏览包含此论文的 12 个收藏集 (https://huggingface.co/collections?paper=2502.14802)
相似文章
Memory-R2: 面向长程记忆增强型LLM代理的公平信用分配
Memory-R2 引入了 LoGo-GRPO,这是一种结合了局部与全局分组相对优化的训练框架,为长程记忆增强型LLM代理提供更公平的信用分配,从而在多种骨干网络上提升准确率和推理延迟。
LatentRAG:用于高效智能体 RAG 的潜在推理与检索
LatentRAG 是一个新颖的框架,将智能体 RAG 的推理与检索过程转移至连续的潜在空间,在保持与显式方法相当的性能的同时,将推理延迟降低了约 90%。
RAGognizer:通过检测头集成实现幻觉感知微调
RAGognizer 提出了一种幻觉感知微调方法,该方法将轻量级检测头集成到大语言模型(LLMs)中,以实现语言建模与幻觉检测的联合优化,适用于 RAG 系统。论文介绍了 RAGognize,一个包含自然发生的闭域幻觉及其词元级标注的数据集,并展示了在降低幻觉率的同时,实现了最先进的幻觉检测性能,且不损害语言质量。
RAG-Anything:全能型 RAG 框架
RAG-Anything 是一个全新的开源框架,通过整合跨模态关系和语义匹配来增强多模态知识检索,在复杂的基准测试中表现优于现有方法。
@TheTuringPost:2026年需了解的20种高级RAG类型 - 思维场景感知RAG (MiA-RAG)、基于超图记忆的多步RAG (HGMem)……
本文概述了预计在2026年具有相关性的20种高级RAG(检索增强生成)类型,涵盖长文档记忆、自适应检索、多模态接地、多语言问答、图推理以及安全导向的RAG方法。