@a1zhang: RLM arXiv 论文更新：depth>1 的结果、更多比较、更多训练和更多错误分析！我们增加了 depth=2/3 的实验…

X AI KOLs Following 2026/05/12 15:04 论文

arxiv-paper rlm recursive-language-model depth-experiments performance-gains error-analysis open-source

摘要

此次RLM arXiv论文更新增加了使用递归RLM调用的depth>1实验，在OOLONG-Pairs和其他基准测试中显示出显著的性能提升，同时还增加了与OpenCode和Claude Code的新比较、在MRCRv2上的额外训练结果，以及扩展的错误分析。

RLM arXiv论文更新：depth>1的结果、更多比较、更多训练和更多错误分析！我们增加了depth=2/3的实验，其中RLM现在可以访问递归RLM调用。这也是开源 `rlm` 仓库的一个特性。我们观察到在OOLONG-Pairs上有显著的性能提升，并在所有其他基准测试上也有提升！我们还根据广泛要求增加了各种OpenCode和Claude Code的比较。我们在MRCRv2上添加了一个长度泛化实验以展示更有前景的训练结果，添加了一个关于OOLONG的小型提示案例研究，并更新了错误分析部分，讨论了语法错误、分解错误的影响以及来自RLM轨迹的总体观察。附录现在也更新了几个新实验和图表！

查看原文

@a1zhang: RLM arXiv 论文更新：depth>1 的结果、更多比较、更多训练和更多错误分析！我们增加了 depth=2/3 的实验…

相似文章

强化递归语言模型（18分钟阅读）

DeepSeek V4 完整论文发布：FP4 QAT 技术细节与训练稳定性技巧 [D]

18 款 LLM OCR 实测（7k+ 次调用）：便宜/旧模型常吊打旗舰，完整数据集+框架已开源 [R]

@hbouammar：也许长上下文推理别再靠模型自己写递归控制代码了。我们开源了 λ-RLM……

$R^2$-dLLM：通过时空冗余削减加速扩散大语言模型

提交意见反馈