multi-hop

#multi-hop

我们开源了一个无图的多跳RAG框架——在基准测试上匹配Graph-RAG的准确率，无需重建成本（Apache-2.0）

Reddit r/AI_Agents ↗ · 昨天

MOTHRAG是一个无图的多跳RAG框架，在基准测试上匹配GraphRAG和HippoRAG等基于图的系统的准确率，同时通过使用密集索引和查询时编排避免昂贵的图重建。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.CL ↗ · 2天前缓存

本文引入了answer-in-context，一种用于预算受限多跳RAG的诊断指标，用于衡量黄金答案是否存在于打包后的读者上下文中，并提出了一种子模证据打包方法，在特定条件下优于启发式方法。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.AI ↗ · 5天前缓存

提出 OPI，一种面向多跳知识图谱问答的本体引导框架，利用以关系为中心的本体图进行双向检索和迭代精炼，在多个基准上取得了最先进的结果。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.AI ↗ · 2026-06-17 缓存

FlowRAG 提出了一种新颖的语义感知检索框架，该框架构建了四层异构图，并利用频率感知的加权流提取显式推理路径，在复杂推理基准测试中取得了最先进的性能。

0 人收藏 0 人点赞

#multi-hop

X AI KOLs Timeline ↗ · 2026-06-12

作者描述使用基于Qwen模型构建的知识图谱提取器来生成具有挑战性的多跳问答对，用于评估智能体搜索系统。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.CL ↗ · 2026-06-12 缓存

本文介绍了EvoBrowseComp，这是一个动态基准测试，包含400个英文和400个中文复杂问题，通过实时网络遍历合成，用于评估搜索代理，避免测试集污染，确保对参数记忆的鲁棒性。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.CL ↗ · 2026-06-11 缓存

一项综合分析超过300篇关于LLM推理的论文，提出了推理范式的分类体系，包括Chain-of-Thought、Multi-Hop、Mathematical、Commonsense等，并总结了常见的失败模式和研究空白。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.CL ↗ · 2026-06-10 缓存

介绍了一个基准测试，用于评估知识编辑方法如何处理事实编辑的逻辑后果，揭示了像ROME和FT这样的现有方法能准确插入直接断言，但未能传播蕴含知识，性能差距高达24%。

0 人收藏 0 人点赞

#multi-hop

arXiv cs.CL ↗ · 2026-05-08 缓存

AdaGATE 是一种免训练的证据控制器，用于多跳 RAG。它采用以实体为中心的间隙追踪、微查询生成和基于效用的选择机制，提升了在噪声检索条件下的鲁棒性，在输入令牌更少的情况下达到了最先进的证据 F1 值。

0 人收藏 0 人点赞