evidence-selection

#evidence-selection

量子启发式轨迹增强证据选择：用于结构化假设空间推理

arXiv cs.AI ↗ · 2026-06-08 缓存

本文介绍了一种量子启发式方法EP-HUBO，它将链式思维推理中的证据选择视为组合优化问题，通过允许少数但正确的假设覆盖嘈杂的多数，在MMLU-Pro法律和LEXam等法律推理基准测试中显著提升了性能。

0 人收藏 0 人点赞

#evidence-selection

TLDR AI ↗ · 2026-05-13 缓存

本文探讨了利用强化学习微调小型（4B）递归语言模型（RLM）从科学文档中选取证据，结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下，达到了与Claude Sonnet 4.6相当的性能。

0 人收藏 0 人点赞

#evidence-selection

arXiv cs.CL ↗ · 2026-05-08 缓存

AdaGATE 是一种免训练的证据控制器，用于多跳 RAG。它采用以实体为中心的间隙追踪、微查询生成和基于效用的选择机制，提升了在噪声检索条件下的鲁棒性，在输入令牌更少的情况下达到了最先进的证据 F1 值。

0 人收藏 0 人点赞