零样本仿真到现实机器人学习:关于反应性抓取的灵巧操作研究
摘要
本文介绍了域随机化实例集(DRIS),一种同时表示多个随机化实例的方法,以改善灵巧操作的仿真到现实迁移。该方法在具有平板末端执行器且要求无真实世界微调的反应性抓取任务上展示了零样本迁移。
查看缓存全文
缓存时间: 2026/05/20 18:39
论文页面 - Zero-Shot Sim-to-Real 机器人学习:反应性抓取的灵巧操控研究
来源: https://huggingface.co/papers/2605.09789
摘要
域随机化实例集 (DRIS) 通过同时表示多个随机化实例,为灵巧操控任务实现鲁棒策略学习,无需大量真实世界微调即可实现强大的仿真到真实迁移。
灵巧操控是物理密集型的,并且对建模错误和感知噪声高度敏感,这使得仿真到真实迁移 (https://huggingface.co/papers?q=sim-to-real%20transfer) 变得极具挑战性。域随机化 (https://huggingface.co/papers?q=Domain%20randomization) (DR) 常用于提高所学策略对此类任务的鲁棒性,但传统的 DR 每个回合只随机化一个实例,对真实世界动态变化的暴露非常有限。为此,我们提出域随机化实例集 (https://huggingface.co/papers?q=Domain-Randomized%20Instance%20Set) (DRIS),它同时表示并传播一组随机化实例,提供对不确定动态更丰富的近似,使策略能够学习考虑多种可能结果的动作。在理论分析的支持下,我们证明 DRIS 可以产生更鲁棒的策略,即使使用少量实例 (例如 10 个),也能减轻对真实世界微调的需求。我们在一项具有挑战性的反应性抓取 (https://huggingface.co/papers?q=reactive%20catching) 任务上展示了这一点。与传统的使用旨在机械稳定物体的末端执行器 (例如弯曲或包围表面) 的抓取设置不同,我们的系统使用平板,不提供被动稳定,这使得任务对噪声高度敏感,需要快速反应动作。学习到的策略对不确定性表现出强大的鲁棒性,并实现了可靠的零样本仿真到真实迁移 (https://huggingface.co/papers?q=sim-to-real%20transfer)。
查看 arXiv 页面 (https://arxiv.org/abs/2605.09789) 查看 PDF (https://arxiv.org/pdf/2605.09789) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.09789)
引用此论文的模型0
没有模型链接此论文
在模型的 README.md 中引用 arxiv.org/abs/2605.09789 以从此页面链接。
引用此论文的数据集0
没有数据集链接此论文
在数据集的 README.md 中引用 arxiv.org/abs/2605.09789 以从此页面链接。
引用此论文的空间0
没有空间链接此论文
在空间的 README.md 中引用 arxiv.org/abs/2605.09789 以从此页面链接。
包含此论文的收藏0
没有收藏包含此论文
将此论文添加到收藏 (https://huggingface.co/new-collection) 以从此页面链接。
相似文章
DeVI:基于物理的灵巧人-物交互,通过合成视频模仿实现
DeVI 提出一种框架,借助混合 3D-2D 跟踪奖励,将文本驱动的合成视频转化为具备物理可信度的灵巧机器人控制,实现对未见物体的零样本泛化。
通过动力学随机化实现机器人控制的仿真到现实迁移
OpenAI 研究人员演示了一种通过使用随机化的模拟器动力学来训练策略,从而弥合现实差距的方法。这使得完全在仿真环境中训练的机器人能够成功迁移到现实世界任务,如物体操作,无需进行物理训练。
学习灵巧性
OpenAI 宣布推出 Dactyl,这是一个通过模拟和强化学习来学习机器人手灵巧性的系统,使用 LSTM 来在不同物理环境中泛化,并通过 Rapid PPO 实现来训练能够迁移到现实世界操纵任务的策略。
通过学习深度逆动力学模型实现从仿真到真实世界的转移
# 通过学习深度逆动力学模型实现从仿真到真实世界的转移 来源: [https://openai.com/index/transfer-from-simulation-to-real-world-through-learning-deep-inverse-dynamics-model/](https://openai.com/index/transfer-from-simulation-to-real-world-through-learning-deep-inverse-dynamics-model/) ## 摘要 在仿真环境中开发控制策略通常比直接在真实世界中运行实验更加实际和安全。这适用于从强化学习中获得的策略
域随机化与生成模型在机器人抓取中的应用
# 域随机化与生成模型在机器人抓取中的应用 来源:[https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/](https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/) ## 摘要 基于深度学习的机器人抓取在算法改进和数据可用性增加的推动下取得了重大进展。然而,最先进的模型往往仅在数百或数千个未