从RAG到记忆:大型语言模型的非参数持续学习

Papers with Code Trending 论文

摘要

HippoRAG 2通过更深入的段落整合和更有效的LLM使用改进了RAG,在事实性、意义构建和联想记忆任务上全面优于标准RAG,实现了非参数持续学习。

我们持续获取、组织并运用知识的能力是人类智能的关键特征,人工智能系统必须接近这一能力才能发挥其全部潜力。鉴于大型语言模型(LLM)在持续学习中的挑战,检索增强生成(RAG)已成为引入新信息的主要方式。然而,其对向量检索的依赖使其难以模仿人类长期记忆的动态性和互联性。近期的RAG方法通过用知识图谱等结构增强向量嵌入来应对其中的一些不足,即意义构建和联想性。但在更基础的事实记忆任务上,它们的性能明显低于标准RAG。我们解决了这一非预期的退化问题,并提出了HippoRAG 2,这是一个在事实性、意义构建和联想记忆任务上全面优于标准RAG的框架。HippoRAG 2基于HippoRAG中使用的个性化PageRank算法,并通过更深入的段落整合和更有效的LLM在线使用对其进行了增强。这种结合使该RAG系统更接近人类长期记忆的效果,在联想记忆任务上比最先进的嵌入模型提高了7%,同时还展现了更优的事实知识和意义构建记忆能力。这项工作为LLM的非参数持续学习铺平了道路。我们的代码和数据将在https://github.com/OSU-NLP-Group/HippoRAG发布。
查看原文
查看缓存全文

缓存时间: 2026/06/18 23:42

论文页面 - 从RAG到记忆:大语言模型的非参数持续学习

来源:https://huggingface.co/papers/2502.14802 发布日期:2025年2月20日

摘要

HippoRAG 2 通过整合段落信息并利用更有效的 LLM 来增强 RAG,在事实性、意义构建和联想记忆任务上均提升了性能。

我们持续获取、组织和利用知识的能力是人类智能的一个关键特征,AI 系统必须接近这一点才能释放其全部潜力。鉴于大语言模型(LLM)在持续学习中面临的挑战,检索增强生成(RAG)已成为引入新信息的主要方式。然而,其对向量检索的依赖阻碍了其模仿人类长期记忆动态且相互关联本质的能力。近期的 RAG 方法通过利用知识图谱等结构来增强向量嵌入,以解决部分不足,即意义构建和联想性。但它们在更基础的事实性记忆任务上的性能却明显低于标准 RAG。我们针对这一非预期的退化进行了改进,并提出了 HippoRAG 2 框架,该框架在事实性、意义构建和联想记忆任务上全面超越了标准 RAG。HippoRAG 2 基于 HippoRAG 中使用的 Personalized PageRank 算法,并通过更深入的段落整合以及更有效地在线使用 LLM 来增强。这种组合使该 RAG 系统更接近人类长期记忆的效果,在联想记忆任务上比最先进的嵌入模型提升了 7%,同时展现出更优的事实性知识和意义构建记忆能力。这项工作为 LLM 的非参数持续学习铺平了道路。我们的代码和数据将在 https://github.com/OSU-NLP-Group/HippoRAG 上发布。

查看 arXiv 页面 (https://arxiv.org/abs/2502.14802)
查看 PDF (https://arxiv.org/pdf/2502.14802)
GitHub 3.69k auto (https://github.com/OSU-NLP-Group/HippoRAG)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2502.14802)

在你的 Agent 中获取这篇论文:

hf papers read 2502.14802

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用该论文的模型 1

muthuk1/graphrag-inference-hackathon (https://huggingface.co/muthuk1/graphrag-inference-hackathon)

引用该论文的数据集 2

osunlp/HippoRAG_2 预览 • 更新于 2025年4月2日 • 410 • 9 (https://huggingface.co/datasets/osunlp/HippoRAG_2)

g7haha/HippoRAG_2 预览 • 更新于 5月6日 • 36 (https://huggingface.co/datasets/g7haha/HippoRAG_2)

引用该论文的 Spaces 0

没有链接此论文的 Space

在 Space 的 README.md 中引用 arxiv.org/abs/2502.14802 即可链接到此页面。

包含该论文的收藏集 12

浏览包含此论文的 12 个收藏集 (https://huggingface.co/collections?paper=2502.14802)

相似文章

RAGognizer:通过检测头集成实现幻觉感知微调

arXiv cs.CL

RAGognizer 提出了一种幻觉感知微调方法,该方法将轻量级检测头集成到大语言模型(LLMs)中,以实现语言建模与幻觉检测的联合优化,适用于 RAG 系统。论文介绍了 RAGognize,一个包含自然发生的闭域幻觉及其词元级标注的数据集,并展示了在降低幻觉率的同时,实现了最先进的幻觉检测性能,且不损害语言质量。

RAG-Anything:全能型 RAG 框架

Papers with Code Trending

RAG-Anything 是一个全新的开源框架,通过整合跨模态关系和语义匹配来增强多模态知识检索,在复杂的基准测试中表现优于现有方法。