alexzhang13/rlm

GitHub Trending (daily) 论文

摘要

递归语言模型(RLMs)引入了一种与任务无关的推理范式,使语言模型能够通过递归地在输入上调用自身来处理近乎无限的上下文,同时还提供了配套的开源推理引擎和训练环境。

用于递归语言模型 (RLMs) 的通用即插即用推理库,支持多种沙箱环境。
查看原文
查看缓存全文

缓存时间: 2026/06/17 11:35

递归语言模型(RLMs)

完整论文 • 博客文章 • 文档 • RLM Minimal

相似文章

递归语言模型

Papers with Code Trending

本文介绍了递归语言模型(Recursive Language Models, RLMs),这是一种推理策略,使大型语言模型(LLMs)能够通过将任意长的提示视为外部环境,并在提示片段上递归调用自身来处理这些提示。RLMs可以处理超出上下文窗口两个数量级的输入,并且在长上下文任务上以可比的成本优于基础LLMs。

强化递归语言模型(18分钟阅读)

TLDR AI

本文探讨了利用强化学习微调小型(4B)递归语言模型(RLM)从科学文档中选取证据,结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下,达到了与Claude Sonnet 4.6相当的性能。