multi-hop-reasoning

#multi-hop-reasoning

Multimodal CoLRAG-TF: 面向复杂PDF的三重过滤检索

arXiv cs.LG ↗ · 昨天缓存

介绍了Multimodal CoLRAG-TF，一种四轴融合架构，用于在复杂PDF上进行检索增强生成，整合了稠密文本、BM25、知识图谱三重过滤和图像相似性。在日文灾难教训PDF基准上，多跳推理取得了显著改进。

0 人收藏 0 人点赞

#multi-hop-reasoning

Telco-GAIA：电信领域智能体的双语基准测试

arXiv cs.AI ↗ · 昨天缓存

Telco-GAIA是一个用于评估电信领域工具使用智能体的双语多模态基准测试，包含100个经过人工验证的任务，要求对异构来源进行多跳推理，并通过精确字符串匹配进行客观评分。

0 人收藏 0 人点赞

#multi-hop-reasoning

Search-on-Graph-R1：使用强化学习训练大型语言模型搜索知识图谱

arXiv cs.CL ↗ · 3天前缓存

本文提出了Search-on-Graph-R1（SoG-R1），该模型通过首先使用黄金SPARQL查询搭建前沿教师模型以生成有依据的轨迹，然后应用监督微调和强化学习，训练一个8B参数的大型语言模型在知识图谱中导航。这个紧凑的模型在WebQSP、CWQ和GrailQA上超越了冻结的前沿系统，尤其是在CWQ上取得了所有对比方法中的最佳结果。

0 人收藏 0 人点赞

#multi-hop-reasoning

DeLIVeR: 基于强化知识图谱探索的分解式信息真实性识别

arXiv cs.CL ↗ · 4天前缓存

DeLIVeR 是一个框架，它使用强化规划器大语言模型将主张分解为问题集，用于结构化知识图谱遍历，在基准数据集上比静态RAG基线提高了10-15%的事实核查准确率。

0 人收藏 0 人点赞

#multi-hop-reasoning

GRASP：面向代理型RAG的粒度感知搜索策略

Hugging Face Daily Papers ↗ · 2026-07-11 缓存

介绍GRASP，一种强化学习框架，训练智能体在多步推理中自适应地协调语义搜索、关键词搜索和段落读取，提高了多跳基准上的检索召回率和问答性能。

0 人收藏 0 人点赞

#multi-hop-reasoning

RSF-GLLM: 通过递归软流与解耦LLM生成弥合多跳知识图谱问答中的语义鸿沟

arXiv cs.CL ↗ · 2026-07-08 缓存

本文介绍了RSF-GLLM，一个将可微图推理与LLM生成解耦的框架，以解决多跳知识图谱问答中的语义鸿沟问题，在实现竞争性性能的同时，具有卓越的推理效率。

0 人收藏 0 人点赞

#multi-hop-reasoning

GraphRAG 在 AI 代理中何时真正值得使用？

Reddit r/AI_Agents ↗ · 2026-07-07

一位开发者反思了何时 GraphRAG 比标准 RAG 更适合 AI 代理，指出它在多跳推理和关系理解方面很有价值，但增加了显著的复杂性。

0 人收藏 0 人点赞

#multi-hop-reasoning

DiscoLoop: 循环离散嵌入与连续隐藏状态的多跳推理

arXiv cs.CL ↗ · 2026-07-02 缓存

DiscoLoop 提出了一种循环架构，该架构同时携带离散嵌入通道和连续隐藏状态通道，用于改进 Transformer 在多跳推理中的表现，在合成任务上实现了近乎完美的准确率，在真实语言建模中表现更优。

0 人收藏 0 人点赞

#multi-hop-reasoning

Tutorial on the loop transformer architecture (rumored to be the major Mythos improvement; 19 minutes)

Reddit r/singularity ↗ · 2026-07-01 缓存

循环Transformer通过直接在架构中设计递归来实现内部推理，避免思维链必须通过生成离散token来模拟迭代的低效性，最新研究表明它在多跳推理上表现出色，并可通过稳定技术和自适应递归进一步提升。

0 人收藏 0 人点赞

#multi-hop-reasoning

通过语言与符号表示之间的模态切换进行空间推理

arXiv cs.AI ↗ · 2026-07-01 缓存

本文探讨了将多跳文本-空间故事嵌入到几何感知模态（如网格）中的方法，展示了从纯语言推理切换到基于网格的推理时性能提升42%，并引入了一种用于LLM模态选择的切换度量。

0 人收藏 0 人点赞

#multi-hop-reasoning

面向多模态核监管文件多跳推理的LLM引导规划

arXiv cs.AI ↗ · 2026-06-30 缓存

本文将监管文件审查问题建模为LLM引导的规划问题，采用无向量文档树，配备浏览、读取和搜索工具，并以动态知识图谱作为状态。在针对NuScale FSAR文档的200个问题基准测试中，该系统达到了81.5%的准确率和0.93的RAGAS忠实度，显著优于现有RAG方法。

0 人收藏 0 人点赞

#multi-hop-reasoning

@aikangarooking: https://x.com/aikangarooking/status/2069325659105861926

X AI KOLs Timeline ↗ · 2026-06-23 缓存

介绍了SAG（SQL-Retrieval Augmented Generation），一种基于SQL动态超边的新型检索增强生成架构，相比传统RAG和GraphRAG在多跳推理上更高效、成本更低，已在GitHub开源并取得不错评测结果。

0 人收藏 0 人点赞

#multi-hop-reasoning

上下文感知与关系感知的图检索增强生成的统一框架

arXiv cs.AI ↗ · 2026-06-17 缓存

本文提出了HyGRAG，一种层次化图RAG框架，整合了上下文与关系信息以支持多跳推理，在现有方法基础上实现了平均准确率提升9.7%。

0 人收藏 0 人点赞

#multi-hop-reasoning

我构建了一个开源知识图谱管道，结合混合检索以改进LLM多跳推理 [P]

Reddit r/MachineLearning ↗ · 2026-06-14

一个开源的全栈管道，从原始文本构建知识图谱，使用混合搜索（密集向量+稀疏+图遍历）解决LLM中的多跳推理问题，并通过倒数排名融合和交叉编码器对结果进行重排序。

0 人收藏 0 人点赞

#multi-hop-reasoning

知识图谱与向量数据库在企业AI中的应用：别再将其视为非此即彼的选择

Reddit r/ArtificialInteligence ↗ · 2026-06-12

文章认为，知识图谱与向量数据库在企业AI中服务于不同目的，应结合使用而非相互替代。它推荐采用混合架构或像60x这样的托管解决方案，以同时处理语义检索和结构推理。

0 人收藏 0 人点赞

#multi-hop-reasoning

构建程序性推理评估数据集：平衡自然性、基础性和多跳覆盖

arXiv cs.AI ↗ · 2026-06-12 缓存

本文探讨了基于TMK的问题生成策略如何影响AI学习系统中程序性和多跳推理的数据集质量，比较了严格TMK生成、先转录后生成和TMK感知生成三种策略，并引入了一个基础性验证框架。

0 人收藏 0 人点赞

#multi-hop-reasoning

SVoT: 基于强化学习的状态感知思维可视化空间推理

arXiv cs.AI ↗ · 2026-06-11 缓存

论文提出了SVoT，一种用于多模态大语言模型（MLLMs）中多跳空间推理的强化学习框架，该框架生成交错、可验证的中间状态和可视化，在涉及多对象交互和数值推理的新基准测试上取得了显著的准确性提升。

0 人收藏 0 人点赞

#multi-hop-reasoning

为什么将残差流限制在层而非令牌？用于连续潜在推理的持久记忆

arXiv cs.AI ↗ · 2026-06-09 缓存

本文识别了CoCoNuT潜在推理范式中的'概念瓶颈'，即隐藏状态在多次传递中被覆盖，并提出了AGCLR，该方法添加了门控持久记忆流以保留中间事实。在GSM8K、HotpotQA和ProsQA上使用GPT-2进行评估，结果显示一致性改进，尤其是在多跳任务上。

0 人收藏 0 人点赞

#multi-hop-reasoning

跨模型激活迁移在Pythia多跳设置中的负面结果

arXiv cs.AI ↗ · 2026-06-03 缓存

本文研究语言模型之间直接激活迁移是否能改善推理能力，使用从Pythia-160M到Pythia-410M的线性翻译层。尽管实现了高表示对齐，但迁移的激活并未改善多跳问答，产生了负面结果。

0 人收藏 0 人点赞

#multi-hop-reasoning

OCC-RAG：面向忠实问答的最优认知核心

arXiv cs.CL ↗ · 2026-06-02 缓存

OCC-RAG 引入了一系列紧凑型小语言模型，这些模型针对忠实问答进行了优化，采用新颖的流程来合成多上下文多跳问答数据。该模型在推理和忠实度基准测试中表现出与大型模型相当的竞争性能。

0 人收藏 0 人点赞

multi-hop-reasoning

提交意见反馈