evidence-selection

标签

Cards List
#evidence-selection

强化递归语言模型(18分钟阅读)

TLDR AI · 6天前 缓存

本文探讨了利用强化学习微调小型(4B)递归语言模型(RLM)从科学文档中选取证据,结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下,达到了与Claude Sonnet 4.6相当的性能。

0 人收藏 0 人点赞
#evidence-selection

AdaGATE:面向多跳检索增强生成的自适应间隙感知、令牌高效证据集成

arXiv cs.CL · 2026-05-08 缓存

AdaGATE 是一种免训练的证据控制器,用于多跳 RAG。它采用以实体为中心的间隙追踪、微查询生成和基于效用的选择机制,提升了在噪声检索条件下的鲁棒性,在输入令牌更少的情况下达到了最先进的证据 F1 值。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈