Dota 2
摘要
OpenAI 创建了一个机器人,仅通过自我对弈学习就能在1v1匹配中击败世界顶级Dota 2职业选手,无需使用模仿学习或树搜索。这一成就展示了人工智能系统在动态、多智能体环境中实现复杂目标的进步。
我们创建了一个机器人,在标准比赛规则下的1v1 Dota 2比赛中击败了世界顶级职业选手。该机器人从零开始通过自我对弈学习这款游戏,不使用模仿学习或树搜索。这是朝着构建能在混乱、复杂且涉及真实人类的情况下实现明确定义目标的人工智能系统迈进的一步。
查看缓存全文
缓存时间: 2026/04/20 14:45
# Dota 2
来源:https://openai.com/index/dota-2/
OpenAI 已经创建了一个机器人,它能在标准比赛规则下击败 Dota 2 的世界顶级职业选手的 1v1 对局。该机器人通过自我对战从零开始学习这款游戏,不使用模仿学习或树搜索。这是朝着构建能在混乱复杂的现实人类交互环境中实现明确目标的 AI 系统迈出的一步。
在 Dota 中获胜需要选手对对手培养直觉并相应地制定计划。在上面的视频中,你可以看到我们的机器人完全通过自我对战学会了预测其他玩家的移动位置、对陌生情况进行即兴应变,以及如何影响对手的友军单位来帮助自己成功。
完整的 Dota 游戏由两支各五人的队伍进行。每个玩家可以从一百多个英雄和数百件物品中选择。我们的下一步是创建一个 Dota 2 机器人团队,可以与顶级人类队伍竞争和协作。如果你有兴趣参与项目的下一阶段,可以考虑[加入 OpenAI](https://openai.com/careers/)。
相似文章
Dota 2 与大规模深度强化学习
OpenAI Five 成为首个利用大规模深度强化学习和自我对弈击败 Dota 2 世界冠军的 AI 系统,在这款具有长期时间跨度和不完全信息的复杂游戏中展现了超人类的表现。
OpenAI Five击败Dota 2世界冠军
OpenAI Five成为首个击败世界冠军电竞职业选手的AI,在OpenAI Five总决赛中连胜OG两局。这一突破是通过前所未有的训练计算规模扩展实现的,而非新型算法,团队计划停用OpenAI Five同时宣布将其部署用于公开网络对战。
更多关于 Dota 2 的内容
OpenAI 描述了他们在国际邀请赛期间对 Dota 2 机器人所做的迭代改进,将教练指导与自我对弈相结合,通过快速训练周期和在职业比赛中发现的战略优化来增强智能体性能。
OpenAI Five
OpenAI Five 是一个强化学习智能体,通过自我对抗训练、课程学习和策略随机化来掌握 Dota 2,从随机行为逐步演进到执行复杂的人类级策略。
竞争性自我对弈
OpenAI 证明在模拟 3D 机器人环境中进行竞争性自我对弈,能够使 AI 智能体在没有明确指导的情况下发现复杂的物理行为,如铲球、躲闪和虚晃等,表明自我对弈将成为未来强大 AI 系统的基础。