multi-hop-reasoning

标签

Cards List
#multi-hop-reasoning

为什么将残差流限制在层而非令牌?用于连续潜在推理的持久记忆

arXiv cs.AI · 昨天 缓存

本文识别了CoCoNuT潜在推理范式中的'概念瓶颈',即隐藏状态在多次传递中被覆盖,并提出了AGCLR,该方法添加了门控持久记忆流以保留中间事实。在GSM8K、HotpotQA和ProsQA上使用GPT-2进行评估,结果显示一致性改进,尤其是在多跳任务上。

0 人收藏 0 人点赞
#multi-hop-reasoning

跨模型激活迁移在Pythia多跳设置中的负面结果

arXiv cs.AI · 2026-06-03 缓存

本文研究语言模型之间直接激活迁移是否能改善推理能力,使用从Pythia-160M到Pythia-410M的线性翻译层。尽管实现了高表示对齐,但迁移的激活并未改善多跳问答,产生了负面结果。

0 人收藏 0 人点赞
#multi-hop-reasoning

OCC-RAG:面向忠实问答的最优认知核心

arXiv cs.CL · 2026-06-02 缓存

OCC-RAG 引入了一系列紧凑型小语言模型,这些模型针对忠实问答进行了优化,采用新颖的流程来合成多上下文多跳问答数据。该模型在推理和忠实度基准测试中表现出与大型模型相当的竞争性能。

0 人收藏 0 人点赞
#multi-hop-reasoning

组合坍缩:稳定的事实知识并不蕴含组合推理

arXiv cs.AI · 2026-05-27 缓存

本文介绍了'组合坍缩'这一现象,即语言模型虽然拥有稳定的事实知识,但仍无法将这些知识组合成正确的多跳推理,并提出了一个双门协议,以将组合失败与原子知识不稳定性分离开来。

0 人收藏 0 人点赞
#multi-hop-reasoning

Decompose-and-Refine: 基于参数化检索的结构化法律问答

arXiv cs.CL · 2026-05-26 缓存

提出Decompose-and-Refine(DaR)框架,用于基于成文法的法律问答。该框架将复杂问题分解为原子子问题,并生成参数化查询以实现精确的成文法检索,在KoBLEX基准测试上取得了改进。

0 人收藏 0 人点赞
#multi-hop-reasoning

@rohanpaul_ai: 斯坦福新论文指出,在同等推理预算下,单个LLM通常比多个……更好地解决多跳问题

X AI KOLs Timeline · 2026-05-17 缓存

一项新的斯坦福论文显示,在同等推理token预算下,单个LLM在多跳推理任务上通常优于多智能体系统,而多智能体设置带来的提升往往来自更多计算而非架构优势。该论文利用数据处理不等式解释为什么交接中的信息丢失会损害多智能体性能,并指出上下文质量是多智能体系统能够提供益处的关键因素。

0 人收藏 0 人点赞
#multi-hop-reasoning

检索很廉价,给我看代码:面向检索增强生成的可执行多跳推理

arXiv cs.AI · 2026-05-14 缓存

本文介绍了PyRAG,这是一个将多跳检索增强生成重新表述为程序合成与执行的框架,使用可执行的Python代码来表示推理步骤,从而实现确定性反馈和自适应检索。

0 人收藏 0 人点赞
#multi-hop-reasoning

@oliviscusAI:有人开源了一个记忆层,在性能上击败了全球所有的RAG系统,名为Memvid。在LoCoMo上SOTA提升35%……

X AI KOLs Timeline · 2026-05-11 缓存

一款名为Memvid的新型开源记忆层宣称超越所有现有RAG系统,在LoCoMo上实现SOTA提升35%,多跳推理提升76%,并打包为单个.mv2文件。

0 人收藏 0 人点赞
#multi-hop-reasoning

上下文收集决策过程:用于智能体搜索的POMDP框架

arXiv cs.AI · 2026-05-11 缓存

本文引入了上下文收集决策过程(CGDP),这是一个用于建模LLM智能体搜索行为的POMDP框架,提出了能够提升多跳推理能力并降低Token消耗且不影响性能的干预措施。

0 人收藏 0 人点赞
#multi-hop-reasoning

文本-图协同:用于 RAG 的双向验证与补全框架

arXiv cs.AI · 2026-05-08 缓存

本文介绍了 TGS-RAG,这是一个双向验证与补全框架,通过协同基于文本和基于图的检索增强生成(RAG),提高了多跳推理的准确性。

0 人收藏 0 人点赞
#multi-hop-reasoning

ConlangCrafter:使用多跳LLM流程构造语言

arXiv cs.CL · 2026-04-20 缓存

ConlangCrafter是一个多跳LLM流程,通过将构造语言(conlang)创建过程分解为包括音系、形态、句法、词汇生成和翻译在内的模块化阶段,实现构造语言的自动化创建。该系统利用LLMs的元语言推理能力,结合随机性注入和自我完善来生成连贯且类型学多样的构造语言。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈