multi-hop

标签

Cards List
#multi-hop

我们开源了一个无图的多跳RAG框架——在基准测试上匹配Graph-RAG的准确率,无需重建成本(Apache-2.0)

Reddit r/AI_Agents · 昨天

MOTHRAG是一个无图的多跳RAG框架,在基准测试上匹配GraphRAG和HippoRAG等基于图的系统的准确率,同时通过使用密集索引和查询时编排避免昂贵的图重建。

0 人收藏 0 人点赞
#multi-hop

什么能保存到上下文中:预算受限多跳RAG的诊断方法与子模证据打包的改进时机

arXiv cs.CL · 2天前 缓存

本文引入了answer-in-context,一种用于预算受限多跳RAG的诊断指标,用于衡量黄金答案是否存在于打包后的读者上下文中,并提出了一种子模证据打包方法,在特定条件下优于启发式方法。

0 人收藏 0 人点赞
#multi-hop

多跳知识图谱问答的本体引导证据路径推理

arXiv cs.AI · 5天前 缓存

提出 OPI,一种面向多跳知识图谱问答的本体引导框架,利用以关系为中心的本体图进行双向检索和迭代精炼,在多个基准上取得了最先进的结果。

0 人收藏 0 人点赞
#multi-hop

FlowRAG:通过频率感知的多粒度图流协同显式推理

arXiv cs.AI · 2026-06-17 缓存

FlowRAG 提出了一种新颖的语义感知检索框架,该框架构建了四层异构图,并利用频率感知的加权流提取显式推理路径,在复杂推理基准测试中取得了最先进的性能。

0 人收藏 0 人点赞
#multi-hop

@hxiao: 我不是知识图谱的粉丝,但最近出于一个令人惊讶的原因开始更频繁地使用它们:构建非平凡的…

X AI KOLs Timeline · 2026-06-12

作者描述使用基于Qwen模型构建的知识图谱提取器来生成具有挑战性的多跳问答对,用于评估智能体搜索系统。

0 人收藏 0 人点赞
#multi-hop

EvoBrowseComp:面向演进知识的搜索代理基准测试

arXiv cs.CL · 2026-06-12 缓存

本文介绍了EvoBrowseComp,这是一个动态基准测试,包含400个英文和400个中文复杂问题,通过实时网络遍历合成,用于评估搜索代理,避免测试集污染,确保对参数记忆的鲁棒性。

0 人收藏 0 人点赞
#multi-hop

LLM推理的周期表:推理范式、方法与失败模式的系统综述

arXiv cs.CL · 2026-06-11 缓存

一项综合分析超过300篇关于LLM推理的论文,提出了推理范式的分类体系,包括Chain-of-Thought、Multi-Hop、Mathematical、Commonsense等,并总结了常见的失败模式和研究空白。

0 人收藏 0 人点赞
#multi-hop

使用逻辑规则的知识编辑基准测试

arXiv cs.CL · 2026-06-10 缓存

介绍了一个基准测试,用于评估知识编辑方法如何处理事实编辑的逻辑后果,揭示了像ROME和FT这样的现有方法能准确插入直接断言,但未能传播蕴含知识,性能差距高达24%。

0 人收藏 0 人点赞
#multi-hop

AdaGATE:面向多跳检索增强生成的自适应间隙感知、令牌高效证据集成

arXiv cs.CL · 2026-05-08 缓存

AdaGATE 是一种免训练的证据控制器,用于多跳 RAG。它采用以实体为中心的间隙追踪、微查询生成和基于效用的选择机制,提升了在噪声检索条件下的鲁棒性,在输入令牌更少的情况下达到了最先进的证据 F1 值。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈