标签
本文对RAG系统在三种评估构念下的八种自动归因指标进行了审计,发现同一构念内没有单一指标能在数据集间迁移,挑战了将它们视为可互换的常见做法。
本文介绍了归一化上下文利用(NCU)指标,用于量化RAG系统中上下文信息的增益。该指标挑战了规模定律,表明在严格的事实提取中,小语言模型由于较低的“先验主导性”可以与更大模型匹敌甚至更优,并且一个商业API在对抗性设置中经常覆盖外部证据。
文章介绍了‘知识代理’,这是一种通过混合检索系统将相关知识注入AI代理的方法论,使得较小的模型在金融、政策、医疗等专业领域超越大型前沿模型。
作者提出以IdeaBlock(问题-答案+治理字段)替代传统chunk来改进RAG知识单元,已开源Blockify工具,可减少40倍语料、3倍token并提升2.3倍相关性。
提出了一种无需训练的多跳检索增强生成方法,避免在底层数据变化时进行昂贵的图重建,解决了动态环境中的过时问题。
PixelRAG是一种开源检索系统,它通过截取网页截图并使用视觉语言模型直接从像素中读取答案,从而绕过HTML解析,声称相比基于文本的RAG有显著的准确率提升。
一个推文串,解释了8种不同的RAG架构(Naive、Multimodal、HyDE、Corrective、Graph、Hybrid、Adaptive、Agentic)及其使用场景,并暗示了一种改进的索引技术。
MOTHRAG是一个多跳RAG系统,仅使用普通API调用即可匹配顶尖GPU依赖系统(HippoRAG 2、CoRAG、NeocorRAG)的性能,无需GPU,无需微调,通过pip install加API密钥即可部署。
推文宣布了一个RAG播放列表,涵盖从基础RAG到高级技术(如使用LangChain和LangGraph的CRAG和Self-RAG)的主题,评论区附有链接。
代理型RAG通过AI代理在循环中驱动检索过程,实现多步推理、自动选择数据源和优化查询,解决了标准RAG在处理多跳问题、模糊查询和多数据源时的局限性。
MCompassRAG 通过用主题元数据丰富文本块表示,并利用 LLM 教师蒸馏来增强检索增强生成,在信息效率上平均提升 8.24%,同时延迟比强基线低 5 倍以上。
SproutRAG是一种层次化RAG框架,利用注意力引导的树搜索和渐进式嵌入,从长文档中实现多粒度检索,相较于基线方法将信息效率提升了6.1%。
本文介绍了去耦搜索接地(DSG)——一种供应商无关的架构,它将搜索检索与LLM推理分离,从而能够对提供商路由、缓存和输出合约进行显式控制。实验表明,DSG在成本降低91%和延迟降低68%的情况下,几乎达到了原生搜索的准确率。
CaVe-VLM-CoT是一个基于模块化反思的智能体RAG框架,专为视觉-语言模型设计,通过五阶段流水线强制执行基于证据的推理,在ScienceQA上达到87.1%的准确率,并提出了一套包含23项指标的评估体系。
一条Twitter帖子指出,人工智能行业在RAG的向量检索系统上投入巨资可能并无必要,因为52年前的终端命令'grep'在AI代理上下文中进行精确匹配时表现优于现代语义搜索。
SAG(SQL-Augmented Generation)是一种基于SQL的检索增强生成新方法,通过将数据块转换为事件和实体,利用SQL连接查询实现多跳推理,在MuSiQue数据集上Recall从65.13%提升至80.04%,支持约5亿条数据的秒级线上检索,已开源。
研究人员报告称,经典的grep命令在自主AI代理的检索任务中胜过现代向量数据库,挑战了当前主流的RAG基础设施方法。
本文介绍HistoRAG,一个将史学原则(分离的检索/生成、时间窗口、LLM作为评判者评估)转化为标准RAG架构干预的框架,应用于包含102,189篇Der Spiegel文章的语料库,以满足解释性而非事实性问答需求。
本文提出了HyGRAG,一种层次化图RAG框架,整合了上下文与关系信息以支持多跳推理,在现有方法基础上实现了平均准确率提升9.7%。
FlowRAG 提出了一种新颖的语义感知检索框架,该框架构建了四层异构图,并利用频率感知的加权流提取显式推理路径,在复杂推理基准测试中取得了最先进的性能。