agentic-actions

标签

#agentic-actions

@samsja19: 非常激动人心的工作，旨在弥合强化学习与中期/预训练之间的差距。你可以从环境中学习，超越奖励信号……

X AI KOLs Following ↗ · 4天前缓存

一种名为ECHO的新方法通过在使用工具调用输出上进行下一个词预测，从环境中学习超越奖励信号，将世界建模与代理行为相结合，从而弥合了强化学习与预训练之间的差距。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈