多目标强化学习：具有挑战性的机器人环境与研究建议

OpenAI Blog 2018/02/26 08:00 论文

摘要

OpenAI 推出了一套具有挑战性的多目标强化学习任务，使用 Fetch 和 Shadow Dexterous Hand 硬件，集成到 OpenAI Gym 中，并提出了改进强化学习算法的研究方向。

暂无内容

查看缓存全文

缓存时间: 2026/04/20 14:43

# 多目标强化学习：具有挑战性的机器人环境和研究呼吁来源：https://openai.com/index/multi-goal-reinforcement-learning/ OpenAI ## 摘要本技术报告有两个目的。首先，它介绍了一套基于现有机器人硬件的具有挑战性的连续控制任务（已与 OpenAI Gym 集成）。这些任务包括使用 Fetch 机械臂进行推动、滑动和抓取放置，以及使用 Shadow Dexterous Hand 进行手部物体操作。所有任务都具有稀疏的二元奖励，并遵循多目标强化学习（RL）框架，其中代理通过额外输入被告知要做什么。论文的第二部分提出了一系列具体的研究思路，用于改进 RL 算法，其中大多数与多目标 RL 和后见之明经验回放（Hindsight Experience Replay）相关。

相似文章

研究请求 2.0

OpenAI Blog

# 研究请求 2.0 来源：[https://openai.com/index/requests-for-research-2/](https://openai.com/index/requests-for-research-2/) OpenAI 我们发布了一批七个未解决的问题，这些问题在 OpenAI 的研究过程中出现。如果你不确定从何处开始，这里有一些已解决的入门问题。⭐ 训练一个 LSTM 来解决 `XOR` 问题：即，给定一个比特序列，确定其奇偶性。[LSTM⁠\(opens in a new window\)](http://colah.github.io/posts

多目标强化学习：具有挑战性的机器人环境与研究建议

相似文章

研究请求 2.0

OpenAI Gym Beta

从仿真泛化

机器人研究的关键要素

Safety Gym

提交意见反馈