域随机化与生成模型在机器人抓取中的应用

OpenAI Blog 论文

摘要

# 域随机化与生成模型在机器人抓取中的应用 来源:[https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/](https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/) ## 摘要 基于深度学习的机器人抓取在算法改进和数据可用性增加的推动下取得了重大进展。然而,最先进的模型往往仅在数百或数千个未

暂无内容
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 14:56

# 域随机化和生成模型用于机器人抓取 来源:https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/ ## 摘要 基于深度学习的机器人抓取已经取得了显著进展,这得益于算法改进和数据可用性的增加。然而,最先进的模型通常仅在数百或数千个独特物体实例上进行训练,因此泛化能力可能面临挑战。 在这项工作中,我们探索了一个新颖的数据生成管道,用于训练深度神经网络执行抓取规划,将域随机化的思想应用于物体合成。我们生成了数百万个独特的、不真实的程序生成物体,并训练深度神经网络在这些物体上执行抓取规划。由于给定物体的成功抓取分布可能具有高度多模态性,我们提出了一个自回归抓取规划模型,将场景的传感器输入映射到可能抓取的概率分布。该模型使我们能够在测试时高效地采样抓取(或完全避免采样)。 我们在仿真和真实世界中评估了我们的模型架构和数据生成管道。尽管仅在随机物体上进行了训练,我们发现在仿真中对之前未见过的真实物体的测试可以达到 >90% 的成功率。我们还展示了在真实世界抓取尝试中 80% 的成功率,尽管仅在随机模拟物体上进行了训练。

相似文章

现实世界中的垃圾邮件检测

OpenAI Blog

OpenAI 演示了域随机化——在模拟训练数据中随机改变颜色、纹理、光照和相机设置——使深度学习模型能够有效地从模拟环境迁移到实际机器人垃圾邮件检测任务,无需从头开始重新训练。

通过动力学随机化实现机器人控制的仿真到现实迁移

OpenAI Blog

OpenAI 研究人员演示了一种通过使用随机化的模拟器动力学来训练策略,从而弥合现实差距的方法。这使得完全在仿真环境中训练的机器人能够成功迁移到现实世界任务,如物体操作,无需进行物理训练。

用机器人手解魔方

OpenAI Blog

OpenAI 开发了一个能够解魔方的机器人手,采用了一种名叫自动域随机化 (ADR) 的新技术,通过逐步提高模拟难度,使学到的行为能有效地从模拟环境迁移到真实世界。

RAD-2:在生成器-判别器框架中扩展强化学习

Hugging Face Daily Papers

RAD-2 提出了一个用于自动驾驶的统一生成器-判别器框架,将基于扩散的轨迹生成与强化学习优化的重排序相结合,与基于扩散的规划器相比,碰撞率降低了56%。该方法引入了 Temporally Consistent Group Relative Policy Optimization 和 BEV-Warp 仿真环境等技术,以实现高效的大规模训练。

生成式模型

OpenAI Blog

OpenAI 发布了关于生成式模型的概览,将其作为开发机器理解世界的方法,解释了这些模型如何通过学习生成与训练集相似的数据来工作,以及它们在各个领域的潜在应用。