@DanKornas:你的RAG流水线不需要重复检索同一份证据。LeanRAG是一个开源的RAG框架,它利用……
摘要
LeanRAG是一个开源的RAG框架,它利用知识图谱、语义聚合和分层检索来减少检索流水线中的冗余,并提供带有简洁证据路径的接地答案。
查看缓存全文
缓存时间: 2026/07/02 08:19
你的RAG流水线无需重复检索同一份证据。
LeanRAG是一个开源RAG框架,它利用知识图谱、语义聚合和分层检索,从结构化证据中生成有依据的答案。
它通过将实体聚类为摘要节点、遍历多层图结构,并向大语言模型发送简洁的证据路径,帮助你构建冗余更少的检索流水线。
主要特性:
• 语义聚合 – 将低层实体聚类为具有明确关系的连贯摘要
• 分层检索 – 将查询锚定在详细实体上,然后向上遍历图结构
• 冗余感知合成 – 精简检索路径,避免在生成前出现内容重叠
• 两种提取路径 – 包括CommonKG和GraphRAG风格的实体与关系提取方法
• 端到端工作流 – 涵盖文档分块、图构建、检索和最终答案生成
免费公开GitHub仓库。链接见回复。
相似文章
@tom_doerr: 基于语义聚合和层次化检索的RAG知识图谱框架 https://github.com/KnowledgeXLa…
LeanRAG是一个开源框架,它利用知识图谱结构,通过语义聚合和层次化检索增强检索增强生成(RAG),以提供上下文感知、高保真的响应。该论文已被AAAI-26接收。
GRACE-RAG:规范证据合成的受控检索架构,支持在封闭领域机构环境中轻量化部署
本文介绍了 GRACE-RAG,这是一种检索受控、图增强的 RAG 架构,它将结构推理从生成过程外化到结构化的检索层,从而能够在封闭领域的机构环境中实现轻量化部署。实验表明,在中规模模型上质量提升高达 20%,同时减少了计算和延迟开销。
AgenticRAG:面向企业知识库的代理检索
本文介绍了 AgenticRAG,这是一个来自微软的框架,通过为大型语言模型(LLM)配备迭代搜索、文档导航和分析工具,增强了企业知识库的检索能力。它在多个基准测试中展示了相比标准 RAG 流水线在召回率和事实准确性方面的显著提升。
RAG-Anything:全能型 RAG 框架
RAG-Anything 是一个全新的开源框架,通过整合跨模态关系和语义匹配来增强多模态知识检索,在复杂的基准测试中表现优于现有方法。
LatentRAG:用于高效智能体 RAG 的潜在推理与检索
LatentRAG 是一个新颖的框架,将智能体 RAG 的推理与检索过程转移至连续的潜在空间,在保持与显式方法相当的性能的同时,将推理延迟降低了约 90%。