retrieval-augmented-generation

#retrieval-augmented-generation

LLM归因指标能否迁移？跨数据集与构念的检索增强生成评估审计

arXiv cs.CL ↗ · 23小时前缓存

本文对RAG系统在三种评估构念下的八种自动归因指标进行了审计，发现同一构念内没有单一指标能在数据集间迁移，挑战了将它们视为可互换的常见做法。

0 人收藏 0 人点赞

#retrieval-augmented-generation

量化RAG系统中的先验主导性

arXiv cs.CL ↗ · 23小时前缓存

本文介绍了归一化上下文利用（NCU）指标，用于量化RAG系统中上下文信息的增益。该指标挑战了规模定律，表明在严格的事实提取中，小语言模型由于较低的“先验主导性”可以与更大模型匹敌甚至更优，并且一个商业API在对抗性设置中经常覆盖外部证据。

0 人收藏 0 人点赞

#retrieval-augmented-generation

知识代理：通过更好的结构超越前沿模型（18分钟阅读）

TLDR AI ↗ · 2天前缓存

文章介绍了‘知识代理’，这是一种通过混合检索系统将相关知识注入AI代理的方法论，使得较小的模型在金融、政策、医疗等专业领域超越大型前沿模型。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@XiaohuiAI666: 你的 RAG 实现方法是错误的！传统 chunk 缺乏知识边界、版本信息和元数据，导致检索上下文缺失、版本混杂、权限控制困难。作者提出的新方法以 IdeaBlock（问题-答案+治理字段）替代 chunk，实现结构化知识单元。不改检…

X AI KOLs Timeline ↗ · 3天前缓存

作者提出以IdeaBlock（问题-答案+治理字段）替代传统chunk来改进RAG知识单元，已开源Blockify工具，可减少40倍语料、3倍token并提升2.3倍相关性。

0 人收藏 0 人点赞

#retrieval-augmented-generation

大多数多跳RAG在数据变化时就会变得过时，那么有没有一种无需训练的方法可以跳过图重建？

Reddit r/artificial ↗ · 3天前

提出了一种无需训练的多跳检索增强生成方法，避免在底层数据变化时进行昂贵的图重建，解决了动态环境中的过时问题。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@akshay_pachaar: 网页抓取将彻底改变。(100%开源的大规模视觉搜索) PixelRAG是一种检索系统，可跳过…

X AI KOLs Following ↗ · 4天前缓存

PixelRAG是一种开源检索系统，它通过截取网页截图并使用视觉语言模型直接从像素中读取答案，从而绕过HTML解析，声称相比基于文本的RAG有显著的准确率提升。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@_avichawla: 面向AI工程师的8种RAG架构：（用法说明）1）Naive RAG——纯粹基于向量相似度检索文档…

X AI KOLs Timeline ↗ · 4天前缓存

一个推文串，解释了8种不同的RAG架构（Naive、Multimodal、HyDE、Corrective、Graph、Hybrid、Adaptive、Agentic）及其使用场景，并暗示了一种改进的索引技术。

0 人收藏 0 人点赞

#retrieval-augmented-generation

匹配世界顶尖的多跳RAG系统，无需GPU，无需微调，只需pip install

Reddit r/artificial ↗ · 5天前缓存

MOTHRAG是一个多跳RAG系统，仅使用普通API调用即可匹配顶尖GPU依赖系统（HippoRAG 2、CoRAG、NeocorRAG）的性能，无需GPU，无需微调，通过pip install加API密钥即可部署。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@DanKornas: RAG播放列表你将学到的内容: - 检索增强生成 - LangChain中的文档加载器 - LangChain中的文本分割器 …

X AI KOLs Timeline ↗ · 6天前缓存

推文宣布了一个RAG播放列表，涵盖从基础RAG到高级技术（如使用LangChain和LangGraph的CRAG和Self-RAG）的主题，评论区附有链接。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@amitiitbhu: Agentic RAG Explained Learn here: https://youtube.com/watch?v=6nSegpuWJVw…

X AI KOLs Timeline ↗ · 6天前缓存

代理型RAG通过AI代理在循环中驱动检索过程，实现多步推理、自动选择数据源和优化查询，解决了标准RAG在处理多跳问题、模糊查询和多数据源时的局限性。

0 人收藏 0 人点赞

#retrieval-augmented-generation

MCompassRAG：主题元数据作为段落级检索的语义指南针

arXiv cs.CL ↗ · 6天前缓存

MCompassRAG 通过用主题元数据丰富文本块表示，并利用 LLM 教师蒸馏来增强检索增强生成，在信息效率上平均提升 8.24%，同时延迟比强基线低 5 倍以上。

0 人收藏 0 人点赞

#retrieval-augmented-generation

SproutRAG: 面向长文档RAG的注意力引导树搜索与渐进式嵌入

arXiv cs.CL ↗ · 6天前缓存

SproutRAG是一种层次化RAG框架，利用注意力引导的树搜索和渐进式嵌入，从长文档中实现多粒度检索，相较于基线方法将信息效率提升了6.1%。

0 人收藏 0 人点赞

#retrieval-augmented-generation

将搜索与推理解耦：一种供应商无关的LLM智能体接地架构

arXiv cs.AI ↗ · 6天前缓存

本文介绍了去耦搜索接地（DSG）——一种供应商无关的架构，它将搜索检索与LLM推理分离，从而能够对提供商路由、缓存和输出合约进行显式控制。实验表明，DSG在成本降低91%和延迟降低68%的情况下，几乎达到了原生搜索的准确率。

0 人收藏 0 人点赞

#retrieval-augmented-generation

CaVe-VLM-CoT：一个可解释的视觉-语言模型框架

arXiv cs.AI ↗ · 6天前缓存

CaVe-VLM-CoT是一个基于模块化反思的智能体RAG框架，专为视觉-语言模型设计，通过五阶段流水线强制执行基于证据的推理，在ScienceQA上达到87.1%的准确率，并提出了一套包含23项指标的评估体系。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@DivyanshT91162: 人工智能行业花费数十亿美元解决一个52年前的终端命令早已解决的问题。在过去的…

X AI KOLs Timeline ↗ · 2026-06-17 缓存

一条Twitter帖子指出，人工智能行业在RAG的向量检索系统上投入巨资可能并无必要，因为52年前的终端命令'grep'在AI代理上下文中进行精确匹配时表现优于现代语义搜索。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@teach_fireworks: https://x.com/teach_fireworks/status/2067243590447952212

X AI KOLs Timeline ↗ · 2026-06-17 缓存

SAG（SQL-Augmented Generation）是一种基于SQL的检索增强生成新方法，通过将数据块转换为事件和实体，利用SQL连接查询实现多跳推理，在MuSiQue数据集上Recall从65.13%提升至80.04%，支持约5亿条数据的秒级线上检索，已开源。

0 人收藏 0 人点赞

#retrieval-augmented-generation

@HowToPrompt__：整个向量数据库行业被一个1974年的免费工具打败了。过去两年里，每一家公司……

X AI KOLs Timeline ↗ · 2026-06-17 缓存

研究人员报告称，经典的grep命令在自主AI代理的检索任务中胜过现代向量数据库，挑战了当前主流的RAG基础设施方法。

0 人收藏 0 人点赞

#retrieval-augmented-generation

HistoRAG：通过批判性技术实践将历史方法论嵌入检索增强生成

arXiv cs.CL ↗ · 2026-06-17 缓存

本文介绍HistoRAG，一个将史学原则（分离的检索/生成、时间窗口、LLM作为评判者评估）转化为标准RAG架构干预的框架，应用于包含102,189篇Der Spiegel文章的语料库，以满足解释性而非事实性问答需求。

0 人收藏 0 人点赞

#retrieval-augmented-generation

上下文感知与关系感知的图检索增强生成的统一框架

arXiv cs.AI ↗ · 2026-06-17 缓存

本文提出了HyGRAG，一种层次化图RAG框架，整合了上下文与关系信息以支持多跳推理，在现有方法基础上实现了平均准确率提升9.7%。

0 人收藏 0 人点赞

#retrieval-augmented-generation

FlowRAG：通过频率感知的多粒度图流协同显式推理

arXiv cs.AI ↗ · 2026-06-17 缓存

FlowRAG 提出了一种新颖的语义感知检索框架，该框架构建了四层异构图，并利用频率感知的加权流提取显式推理路径，在复杂推理基准测试中取得了最先进的性能。

0 人收藏 0 人点赞

retrieval-augmented-generation

提交意见反馈