OpenAI Five 基准测试:结果

OpenAI Blog 新闻

摘要

OpenAI 发布了其 Dota 2 游戏系统 OpenAI Five 的基准测试结果,详细介绍了六个主要版本的训练方法,计算需求从 8 到 35 petaflop/s-days 不等,并推出了新的网络架构工具。

昨天,OpenAI Five 在一场三局两胜的比赛中击败了一支由排名前 0.05% 的 Dota 职业选手组成的队伍:Blitz、Cap、Fogged、Merlini 和 MoonMeander——其中四位曾专业参加过 Dota 比赛——比赛在现场观众和 10 万并发直播观众面前进行。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 14:46

# OpenAI Five 基准测试:结果 来源: https://openai.com/index/openai-five-benchmark-results/ 我们通常的开发周期是从零开始训练系统的每个主要版本。但是,这个版本的 OpenAI Five 包含自 6 月 9 日以来在六个主要系统版本中一直在训练的参数。每个版本都是通过前一个版本的参数初始化的。 我们投入大量资源开发了"手术"工具,使我们能够将旧参数映射到新的网络架构。例如,当我们首次训练眼位(ward)放置时,我们使用了一个单一的动作头来确定移动方向和放置眼位的位置。但 Five 经常会在它想要移动的方向上随意放置眼位,我们推测它主要将容量分配给了移动。我们的工具让我们能够将这个头分成两个克隆,并用相同的参数初始化它们。 我们估计在训练各种 Dota 系统时使用了以下计算量(https://openai.com/index/ai-and-compute/): - 1v1 模型:8 petaflop/s-days - 6 月 6 日模型:11 petaflop/s-daysA (https://openai.com/index/openai-five-benchmark-results/#citation-bottom-A) - 8 月 5 日模型:35 petaflop/s-daysA (https://openai.com/index/openai-five-benchmark-results/#citation-bottom-A) 我们还发布了最新的网络架构(在新窗口中打开)(https://cdn.openai.com/dota_benchmark_results/network_diagram_08_06_2018.pdf)。

相似文章

OpenAI Five 基准测试

OpenAI Blog

OpenAI Five 完成了与人类的 Dota 2 基准测试对比赛,展示了改进的能力,包括扩展的英雄池(18 个英雄)、Roshan 坑机制和眼位系统。该系统展现了在学习复杂游戏技能方面的通用训练灵活性。

OpenAI Five

OpenAI Blog

OpenAI Five 是一个强化学习智能体,通过自我对抗训练、课程学习和策略随机化来掌握 Dota 2,从随机行为逐步演进到执行复杂的人类级策略。

OpenAI Five击败Dota 2世界冠军

OpenAI Blog

OpenAI Five成为首个击败世界冠军电竞职业选手的AI,在OpenAI Five总决赛中连胜OG两局。这一突破是通过前所未有的训练计算规模扩展实现的,而非新型算法,团队计划停用OpenAI Five同时宣布将其部署用于公开网络对战。

OpenAI Five Finals

OpenAI Blog

# OpenAI Five Finals 来源:[https://openai.com/index/openai-five-finals/](https://openai.com/index/openai-five-finals/) OpenAI 我们将在4月13日太平洋时间上午11:30举办OpenAI Five的最后一场线下活动。我们将展示OpenAI Five的各个方面,这些方面我们认为能够说明人类和AI在未来如何进行交互。我们相信AI对世界的影响将由其能力、可扩展性和增强人类能力的能力所驱动——本次活动将使用OpenAI Five来具体展示

The International 2018:比赛结果

OpenAI Blog

OpenAI Five 在2018年国际邀请赛中与顶级职业 Dota 2 战队竞争,尽管在与顶尖人类选手的两场比赛中都不幸落败,但展现了通过自我学习所掌握的具有竞争力的游戏表现和战略深度。