domain-randomization

标签

Cards List
#domain-randomization

基础模型体的模拟-现实差距:统一的MDP视角

arXiv cs.AI · 2026-06-08 缓存

本文将基础模型体的模拟-现实差距形式化为马尔可夫决策过程问题,提出了统一的研究议程,以适应如领域随机化等经典解决方案,从而提升智能体在真实部署中的鲁棒性和可靠性。

0 人收藏 0 人点赞
#domain-randomization

OASIS:从仿真数据收集到现实世界人形机器人全身操控

Hugging Face Daily Papers · 2026-06-07 缓存

OASIS是一个仿真数据驱动的框架,用于人形机器人全身操控,它使用3D生成模型和分层视运动策略。通过利用仿真中的域随机化,它在零样本迁移上取得了比真实机器人训练更好的性能。

0 人收藏 0 人点赞
#domain-randomization

零样本仿真到现实机器人学习:关于反应性抓取的灵巧操作研究

Hugging Face Daily Papers · 2026-05-10 缓存

本文介绍了域随机化实例集(DRIS),一种同时表示多个随机化实例的方法,以改善灵巧操作的仿真到现实迁移。该方法在具有平板末端执行器且要求无真实世界微调的反应性抓取任务上展示了零样本迁移。

0 人收藏 0 人点赞
#domain-randomization

用机器人手解魔方

OpenAI Blog · 2019-10-15 缓存

OpenAI 开发了一个能够解魔方的机器人手,采用了一种名叫自动域随机化 (ADR) 的新技术,通过逐步提高模拟难度,使学到的行为能有效地从模拟环境迁移到真实世界。

0 人收藏 0 人点赞
#domain-randomization

从仿真泛化

OpenAI Blog · 2017-10-19 缓存

# 从仿真泛化 来源: [https://openai.com/index/generalizing-from-simulation/](https://openai.com/index/generalizing-from-simulation/) 仿真机器人的强化学习成果充斥市场,这可能会给人一种印象,即强化学习能轻松解决大多数机器人任务。但常见的强化学习算法只在那些对动作的小幅扰动能带来奖励增量变化的任务中表现良好。一些机器人任务具有简单的奖励函数,比如行走任务,可以根据行进距离来评分

0 人收藏 0 人点赞
#domain-randomization

域随机化与生成模型在机器人抓取中的应用

OpenAI Blog · 2017-10-17 缓存

# 域随机化与生成模型在机器人抓取中的应用 来源:[https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/](https://openai.com/index/domain-randomization-and-generative-models-for-robotic-grasping/) ## 摘要 基于深度学习的机器人抓取在算法改进和数据可用性增加的推动下取得了重大进展。然而,最先进的模型往往仅在数百或数千个未

0 人收藏 0 人点赞
#domain-randomization

Python 中更快的物理模拟

OpenAI Blog · 2017-06-28 缓存

OpenAI 开源 mujoco-py,一个使用 MuJoCo 引擎的高性能 Python 机器人模拟库,具有无头 GPU 渲染和 VR 交互支持,性能提升约 40 倍。

0 人收藏 0 人点赞
#domain-randomization

现实世界中的垃圾邮件检测

OpenAI Blog · 2017-04-01 缓存

OpenAI 演示了域随机化——在模拟训练数据中随机改变颜色、纹理、光照和相机设置——使深度学习模型能够有效地从模拟环境迁移到实际机器人垃圾邮件检测任务,无需从头开始重新训练。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈