agent-rl

标签

Cards List
#agent-rl

@billxbf: 很高兴发布 Polar,这是我们用于真实世界工具集的智能体强化学习部署基础设施。无论是 Codex、Claude Code、OpenClaw、Herm…

X AI KOLs Timeline · 2026-05-26 缓存

Polar 是一种智能体强化学习部署基础设施,允许将真实世界的工具集直接用作训练环境,无需修改代码,支持 Codex、Claude Code、OpenClaw 和 Hermes 等模型。

0 人收藏 0 人点赞
#agent-rl

@maximelabonne: 太酷了!来自 @Meituan_LongCat 的同一团队撰写了 Skill0,他们提出了一种用于技能内在化的RL方法。

X AI KOLs Following · 2026-05-17 缓存

该推文重点介绍了美团团队关于 Skill0 的论文,这是一种用于技能内在化的RL方法,并引用了一篇关于自蒸馏智能体RL的相关论文。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈