通过动力学随机化实现机器人控制的仿真到现实迁移

OpenAI Blog 2017/10/18 07:00 论文

sim-to-real robotics dynamics-randomization transfer-learning policy-learning domain-adaptation

摘要

OpenAI 研究人员演示了一种通过使用随机化的模拟器动力学来训练策略，从而弥合现实差距的方法。这使得完全在仿真环境中训练的机器人能够成功迁移到现实世界任务，如物体操作，无需进行物理训练。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:45

# 具有动力学随机化的机器人控制仿真到真实转移来源：https://openai.com/index/sim-to-real-transfer-of-robotic-control-with-dynamics-randomization/ ## 摘要模拟环境对于训练智能体很有吸引力，因为它们提供了丰富的数据来源，并在训练过程中缓解了某些安全问题。然而，智能体在模拟中开发的行为往往特定于模拟器的特征。由于建模误差，在模拟中成功的策略可能无法转移到真实世界。在本论文中，我们演示了一个简单的方法来弥合这个"现实差距"。通过在训练期间随机化模拟器的动力学，我们能够开发出能够适应非常不同的动力学的策略，包括与训练所用动力学差异很大的动力学。这种自适应性使策略能够推广到真实世界的动力学，而无需在物理系统上进行任何训练。我们的方法在使用机器人臂的物体推动任务上进行了演示。尽管完全在模拟中进行训练，我们的策略在部署到真实机器人时能够保持相似的性能水平，可靠地将物体从随机初始配置移动到所需位置。我们探讨了各种设计决策的影响，并表明生成的策略对显著的校准误差具有稳健性。

相似文章

通过学习深度逆动力学模型实现从仿真到真实世界的转移

OpenAI Blog

# 通过学习深度逆动力学模型实现从仿真到真实世界的转移来源: [https://openai.com/index/transfer-from-simulation-to-real-world-through-learning-deep-inverse-dynamics-model/](https://openai.com/index/transfer-from-simulation-to-real-world-through-learning-deep-inverse-dynamics-model/) ## 摘要在仿真环境中开发控制策略通常比直接在真实世界中运行实验更加实际和安全。这适用于从强化学习中获得的策略

从仿真泛化

OpenAI Blog

# 从仿真泛化来源: [https://openai.com/index/generalizing-from-simulation/](https://openai.com/index/generalizing-from-simulation/) 仿真机器人的强化学习成果充斥市场，这可能会给人一种印象，即强化学习能轻松解决大多数机器人任务。但常见的强化学习算法只在那些对动作的小幅扰动能带来奖励增量变化的任务中表现良好。一些机器人任务具有简单的奖励函数，比如行走任务，可以根据行进距离来评分

用于基于图像的机器人学习的非对称演员-评论家方法

OpenAI Blog

OpenAI 提出了一种用于机器人学习的非对称演员-评论家方法，该方法利用模拟器中的完全状态可观性来训练在部分观察（RGBD 图像）上运行的策略，无需真实世界的训练数据即可实现有效的仿真到现实的转移。

现实世界中的垃圾邮件检测

OpenAI Blog

OpenAI 演示了域随机化——在模拟训练数据中随机改变颜色、纹理、光照和相机设置——使深度学习模型能够有效地从模拟环境迁移到实际机器人垃圾邮件检测任务，无需从头开始重新训练。

域随机化与生成模型在机器人抓取中的应用

OpenAI Blog

# 域随机化与生成模型在机器人抓取中的应用来源：[https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/](https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/) ## 摘要基于深度学习的机器人抓取在算法改进和数据可用性增加的推动下取得了重大进展。然而，最先进的模型往往仅在数百或数千个未

相似文章

通过学习深度逆动力学模型实现从仿真到真实世界的转移

从仿真泛化

用于基于图像的机器人学习的非对称演员-评论家方法

现实世界中的垃圾邮件检测

域随机化与生成模型在机器人抓取中的应用

提交意见反馈