rlm

#rlm

@diblacksmith: [开源发布] 这是我工作中使用RLM的经历。自其发布（1月26日）以来，我就开始用它处理日常任务（编码、处理数百万token的日志，甚至自动化浏览器操作）。

X AI KOLs Following ↗ · 2026-06-27 缓存

作者分享了他使用RLM处理日常任务（如编码、处理数百万token的日志和浏览器自动化）的经验，并将其作为一个可通过pip安装的开源Python包发布。

0 人收藏 0 人点赞

#rlm

Show HN：基于RLM的AI代理追踪本地调试器

Hacker News Top ↗ · 2026-06-23 缓存

HALO是一款开源桌面应用，它利用基于模型的强化学习（RLM）技术来本地调试和优化AI代理追踪，并提供分析和可行建议。

0 人收藏 0 人点赞

#rlm

@dosco：使用 perplexity、parallel、Google、X 搜索等，用 DSPy+RLM（ax-agent）在 5 分钟内构建此功能 http://axllm.…

X AI KOLs Timeline ↗ · 2026-06-02 缓存

Ax 是一个开源 TypeScript 库，实现了 DSPy 风格的类型化签名和代理框架，用于以最少的提示词构建可靠的 AI 应用。它支持多个 LLM 提供商，并包含代理、流程、RAG 和自优化管道等功能。

0 人收藏 0 人点赞

#rlm

@neural_avb: RLMs 现在可以通过 `fast-rlm` 访问 MCP 服务器 - 通过 stdio 或 http 连接任意 MCP - RLM 可访问所有 MCP 工具、资…

X AI KOLs Timeline ↗ · 2026-06-01 缓存

fast-rlm 使强化学习模型能够通过 stdio 或 HTTP 访问 MCP 服务器，允许使用工具和获取资源，结果保存为 REPL 中的 Python 变量以节省输入令牌。

0 人收藏 0 人点赞

#rlm

@tech_optimist: 将RLMs和GEPA结合的工作简直太棒了。期待第二部分！

X AI KOLs Following ↗ · 2026-05-30

一条推文赞扬结合RLMs和GEPA的工作，并期待后续内容。

0 人收藏 0 人点赞

#rlm

@neural_avb: `fast-rlm` 新更新查看这个演示，RLM 进行网页搜索（exa），使用工具评论 Goodreads，并推荐书籍！…

X AI KOLs Timeline ↗ · 2026-05-21

`fast-rlm` 新更新引入了 REPL Tool Calling，允许代理通过 REPL 调用 Python 函数，并将输出存储在变量中。演示展示了网页搜索和 Goodreads 评论的集成。

0 人收藏 0 人点赞

#rlm

强化递归语言模型（18分钟阅读）

TLDR AI ↗ · 2026-05-13 缓存

本文探讨了利用强化学习微调小型（4B）递归语言模型（RLM）从科学文档中选取证据，结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下，达到了与Claude Sonnet 4.6相当的性能。

0 人收藏 0 人点赞

#rlm

@a1zhang: RLM arXiv 论文更新：depth>1 的结果、更多比较、更多训练和更多错误分析！我们增加了 depth=2/3 的实验…

X AI KOLs Following ↗ · 2026-05-12

此次RLM arXiv论文更新增加了使用递归RLM调用的depth>1实验，在OOLONG-Pairs和其他基准测试中显示出显著的性能提升，同时还增加了与OpenCode和Claude Code的新比较、在MRCRv2上的额外训练结果，以及扩展的错误分析。

0 人收藏 0 人点赞

#rlm

@isaac_flath：RLM 会让 notebook 回归（希望如此）。Agent 驱动 REPL，中间穿插自然语言，这才是 nb 界面的真正后端。很多人早就嘀咕这想法，RLM 把它落地并跑通。所以期待很快看到 NB 大版本发布！p.s. 如果你

X AI KOLs Following ↗ · 2026-04-21 缓存

Isaac Flath 预测，RLM 将通过让 Agent 在 REPL 中穿插自然语言的方式，让 notebook 重新火起来。

0 人收藏 0 人点赞

#rlm

@dosco：关于把 RLM 和 DSPy 用在多模态数据上的酷文，这段让我脑洞大开……

X AI KOLs Following ↗ · 2026-04-20 缓存

一条社交媒体动态，推荐一篇把 RLM 和 DSPy 应用于多模态数据的文章。

0 人收藏 0 人点赞

#rlm

@sumeetrm：LongCoT 新增两块排行榜！鉴于大家对智能体（尤其是 RLM）的关注，我们新增「受限基准」和「开放基准」双榜。

X AI KOLs Following ↗ · 2026-04-19 缓存

LongCoT 推出两块智能体新榜（受限/开放基准），其中 GPT 5.2 RLM 以 25.12% 的得分领跑开放基准。

0 人收藏 0 人点赞

#rlm

@ekzhu：我读了 RLM 论文，感觉这简直是解决通用问题的最简方案，说真的就是这么简单……

X AI KOLs Timeline ↗ · 2026-04-19 缓存

一位研究人员评论了 RLM 论文的简洁与优雅，将其与具有影响力的 ReAct 论文相提并论，并对其解决通用问题的直观思路表示赞赏。

0 人收藏 0 人点赞

#rlm

@samhogan：顺便提一句，RLM 基本已解决上下文问题。你只需将上千万个 token 投入一个成熟的 RLM 框架中，它就能直接跑通……

X AI KOLs Following ↗ · 2026-04-18 缓存

一位开发者分享了使用 RLM 的实践经验，表示其能够有效承载高达数千万 token 的超长上下文窗口，这标志着上下文处理能力实现了显著跨越。

0 人收藏 0 人点赞

rlm

提交意见反馈