标签
本文认为代理技能应包含视觉信息,而不仅仅是文本,并提出了一种多模态技能范式,将文本逻辑与视觉支持相结合。实验表明,在视觉中心任务中,视觉技能优于纯文本方法。
本文介绍了CARL,一种利用局部动态规律学习可复用技能的离线分层强化学习方法。该方法将需要相似动作序列的状态-目标对进行聚类,从而实现更有效的技能复用,并在复杂的人形机器人任务上提升了性能。
Agent-Sin 是一个 AI 代理,它使用可复用的技能自动完成重复任务,旨在提高生产力。