用机器人手解魔方

OpenAI Blog 2019/10/15 07:00 新闻

robotics reinforcement-learning sim-to-real domain-randomization openai neural-networks

摘要

OpenAI 开发了一个能够解魔方的机器人手，采用了一种名叫自动域随机化 (ADR) 的新技术，通过逐步提高模拟难度，使学到的行为能有效地从模拟环境迁移到真实世界。

我们训练了一对神经网络来用类人机器人手解魔方。这些神经网络完全在模拟环境中进行训练，使用的是与 OpenAI Five 相同的强化学习代码，再加上一种名叫自动域随机化 (ADR) 的新技术。该系统能够处理训练期间从未见过的情况，例如被毛绒长颈鹿戳戳。这表明强化学习不仅是虚拟任务的工具，还可以解决现实世界中需要前所未有的灵巧性的问题。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:55

# 用机器人手解魔方来源：https://openai.com/index/solving-rubiks-cube/ 我们面临的最大挑战是创建足够多样化的模拟环境，以捕捉真实世界的物理特性。摩擦力、弹性和动力学等因素对于魔方或机械手这样复杂的物体来说极其难以测量和建模，我们发现仅靠域随机化是不够的。为了克服这个问题，我们开发了一种名为*自动域随机化*（ADR）的新方法，它可以在模拟中无限生成难度逐步增加的环境。B (https://openai.com/index/solving-rubiks-cube/#citation-bottom-B)这使我们摆脱了对真实世界精确模型的依赖，使在模拟中学习的神经网络能够转移到真实世界应用。 ADR 从一个单一的、未随机化的环境开始，神经网络在其中学习解魔方。随着神经网络在任务中表现不断改进并达到性能阈值，域随机化的程度会自动增加。这使任务变得更加困难，因为神经网络现在必须学会泛化到更多随机化的环境中。网络继续学习，直到再次超过性能阈值，此时更多随机化介入，过程重复进行。

相似文章

@mattpocockuk: 人们说从 /teach 技能中学到的东西不会持久。"AI 真的教会了你解魔方吗？……

X AI KOLs Following

Matt Pocock 展示了他通过 AI 的 /teach 技能学会解魔方，证明 AI 能有效传授动手技能。

学习灵巧性

OpenAI Blog

OpenAI 宣布推出 Dactyl，这是一个通过模拟和强化学习来学习机器人手灵巧性的系统，使用 LSTM 来在不同物理环境中泛化，并通过 Rapid PPO 实现来训练能够迁移到现实世界操纵任务的策略。

零样本仿真到现实机器人学习：关于反应性抓取的灵巧操作研究

Hugging Face Daily Papers

本文介绍了域随机化实例集（DRIS），一种同时表示多个随机化实例的方法，以改善灵巧操作的仿真到现实迁移。该方法在具有平板末端执行器且要求无真实世界微调的反应性抓取任务上展示了零样本迁移。

域随机化与生成模型在机器人抓取中的应用

OpenAI Blog

# 域随机化与生成模型在机器人抓取中的应用来源：[https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/](https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/) ## 摘要基于深度学习的机器人抓取在算法改进和数据可用性增加的推动下取得了重大进展。然而，最先进的模型往往仅在数百或数千个未

通过动力学随机化实现机器人控制的仿真到现实迁移

OpenAI Blog

OpenAI 研究人员演示了一种通过使用随机化的模拟器动力学来训练策略，从而弥合现实差距的方法。这使得完全在仿真环境中训练的机器人能够成功迁移到现实世界任务，如物体操作，无需进行物理训练。

相似文章

@mattpocockuk: 人们说从 /teach 技能中学到的东西不会持久。"AI 真的教会了你解魔方吗？……

学习灵巧性

零样本仿真到现实机器人学习：关于反应性抓取的灵巧操作研究

域随机化与生成模型在机器人抓取中的应用

通过动力学随机化实现机器人控制的仿真到现实迁移

提交意见反馈