标签
本文介绍了用于图组合优化的投影智能体,采用强化学习和图神经网络,在连续动作嵌入空间中运行,以提升泛化能力和可扩展性,并发布了LaGCO-RL库。
本文介绍了 RLA-WM,一种基于视觉特征的世界模型,该模型利用残差潜在动作与流匹配技术高效预测未来视觉状态。该方法性能优于现有的视频扩散与特征基方法,同时支持从离线、无动作演示视频中探索新型机器人学习技术。