rlm

标签

Cards List
#rlm

@diblacksmith: [开源发布] 这是我工作中使用RLM的经历。自其发布(1月26日)以来,我就开始用它处理日常任务(编码、处理数百万token的日志,甚至自动化浏览器操作)。

X AI KOLs Following · 2026-06-27 缓存

作者分享了他使用RLM处理日常任务(如编码、处理数百万token的日志和浏览器自动化)的经验,并将其作为一个可通过pip安装的开源Python包发布。

0 人收藏 0 人点赞
#rlm

Show HN:基于RLM的AI代理追踪本地调试器

Hacker News Top · 2026-06-23 缓存

HALO是一款开源桌面应用,它利用基于模型的强化学习(RLM)技术来本地调试和优化AI代理追踪,并提供分析和可行建议。

0 人收藏 0 人点赞
#rlm

@dosco:使用 perplexity、parallel、Google、X 搜索等,用 DSPy+RLM(ax-agent)在 5 分钟内构建此功能 http://axllm.…

X AI KOLs Timeline · 2026-06-02 缓存

Ax 是一个开源 TypeScript 库,实现了 DSPy 风格的类型化签名和代理框架,用于以最少的提示词构建可靠的 AI 应用。它支持多个 LLM 提供商,并包含代理、流程、RAG 和自优化管道等功能。

0 人收藏 0 人点赞
#rlm

@neural_avb: RLMs 现在可以通过 `fast-rlm` 访问 MCP 服务器 - 通过 stdio 或 http 连接任意 MCP - RLM 可访问所有 MCP 工具、资…

X AI KOLs Timeline · 2026-06-01 缓存

fast-rlm 使强化学习模型能够通过 stdio 或 HTTP 访问 MCP 服务器,允许使用工具和获取资源,结果保存为 REPL 中的 Python 变量以节省输入令牌。

0 人收藏 0 人点赞
#rlm

@tech_optimist: 将RLMs和GEPA结合的工作简直太棒了。期待第二部分!

X AI KOLs Following · 2026-05-30

一条推文赞扬结合RLMs和GEPA的工作,并期待后续内容。

0 人收藏 0 人点赞
#rlm

@neural_avb: `fast-rlm` 新更新 查看这个演示,RLM 进行网页搜索(exa),使用工具评论 Goodreads,并推荐书籍!…

X AI KOLs Timeline · 2026-05-21

`fast-rlm` 新更新引入了 REPL Tool Calling,允许代理通过 REPL 调用 Python 函数,并将输出存储在变量中。演示展示了网页搜索和 Goodreads 评论的集成。

0 人收藏 0 人点赞
#rlm

强化递归语言模型(18分钟阅读)

TLDR AI · 2026-05-13 缓存

本文探讨了利用强化学习微调小型(4B)递归语言模型(RLM)从科学文档中选取证据,结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下,达到了与Claude Sonnet 4.6相当的性能。

0 人收藏 0 人点赞
#rlm

@a1zhang: RLM arXiv 论文更新:depth>1 的结果、更多比较、更多训练和更多错误分析!我们增加了 depth=2/3 的实验…

X AI KOLs Following · 2026-05-12

此次RLM arXiv论文更新增加了使用递归RLM调用的depth>1实验,在OOLONG-Pairs和其他基准测试中显示出显著的性能提升,同时还增加了与OpenCode和Claude Code的新比较、在MRCRv2上的额外训练结果,以及扩展的错误分析。

0 人收藏 0 人点赞
#rlm

@isaac_flath:RLM 会让 notebook 回归(希望如此)。Agent 驱动 REPL,中间穿插自然语言,这才是 nb 界面的真正后端。很多人早就嘀咕这想法,RLM 把它落地并跑通。所以期待很快看到 NB 大版本发布!p.s. 如果你

X AI KOLs Following · 2026-04-21 缓存

Isaac Flath 预测,RLM 将通过让 Agent 在 REPL 中穿插自然语言的方式,让 notebook 重新火起来。

0 人收藏 0 人点赞
#rlm

@dosco:关于把 RLM 和 DSPy 用在多模态数据上的酷文,这段让我脑洞大开……

X AI KOLs Following · 2026-04-20 缓存

一条社交媒体动态,推荐一篇把 RLM 和 DSPy 应用于多模态数据的文章。

0 人收藏 0 人点赞
#rlm

@sumeetrm:LongCoT 新增两块排行榜!鉴于大家对智能体(尤其是 RLM)的关注,我们新增「受限基准」和「开放基准」双榜。

X AI KOLs Following · 2026-04-19 缓存

LongCoT 推出两块智能体新榜(受限/开放基准),其中 GPT 5.2 RLM 以 25.12% 的得分领跑开放基准。

0 人收藏 0 人点赞
#rlm

@ekzhu:我读了 RLM 论文,感觉这简直是解决通用问题的最简方案,说真的就是这么简单……

X AI KOLs Timeline · 2026-04-19 缓存

一位研究人员评论了 RLM 论文的简洁与优雅,将其与具有影响力的 ReAct 论文相提并论,并对其解决通用问题的直观思路表示赞赏。

0 人收藏 0 人点赞
#rlm

@samhogan:顺便提一句,RLM 基本已解决上下文问题。你只需将上千万个 token 投入一个成熟的 RLM 框架中,它就能直接跑通……

X AI KOLs Following · 2026-04-18 缓存

一位开发者分享了使用 RLM 的实践经验,表示其能够有效承载高达数千万 token 的超长上下文窗口,这标志着上下文处理能力实现了显著跨越。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈