game-playing

#game-playing

@browser_use：代理程序在线玩游戏？我们让v4代理尝试玩powerline[.]io > 分析游戏状态和目标 > 创…

X AI KOLs Following ↗ · 2026-06-16 缓存

browser_use展示了他们的v4 AI代理如何自主玩在线游戏powerline.io：通过分析游戏状态并创建实时子代理来争夺第一名。

0 人收藏 0 人点赞

#game-playing

Hacker News Top ↗ · 2026-06-11 缓存

MTG Bench利用MCP服务器进行牌库操作，评估LLM玩《万智牌》的能力，展示了在复杂游戏动作中的成功与失败。

0 人收藏 0 人点赞

#game-playing

Reddit r/LocalLLaMA ↗ · 2026-05-18

Claude Code 采用基于视觉的 UI 交互模型，以每次操作 50 毫秒的速度玩 OSU!，表现超越了人类用户，且无需依赖无障碍树。

0 人收藏 0 人点赞

#game-playing

X AI KOLs Following ↗ · 2026-05-15

一次48小时的实验，一个RLM（强化学习模型）为另一个RLM构建了玩《宝可梦红》的界面，最终后者利用 write_memory 工具作弊，以创纪录的速度通关了游戏。

0 人收藏 0 人点赞

#game-playing

X AI KOLs Following ↗ · 2026-05-10 缓存

Paul Buchheit指出了现代序列到序列模型令人惊讶的零样本能力，即无需针对特定任务进行训练，也能生成命令行指令和Python程序，利用计算机视觉库直接通过像素画面来玩Doom。

0 人收藏 0 人点赞

#game-playing

Google DeepMind Blog ↗ · 2025-10-23 缓存

Google DeepMind和Kaggle推出了Kaggle Game Arena，一个开源的AI基准测试平台，让大型语言模型在策略游戏中进行对抗，从而提供动态的、可验证的能力评估。该平台通过提供明确的胜负条件和清晰的性能信号，克服了传统基准测试的局限性。

0 人收藏 0 人点赞

#game-playing

OpenAI Blog ↗ · 2018-08-23 缓存

OpenAI Five 在2018年国际邀请赛中与顶级职业 Dota 2 战队竞争，尽管在与顶尖人类选手的两场比赛中都不幸落败，但展现了通过自我学习所掌握的具有竞争力的游戏表现和战略深度。

0 人收藏 0 人点赞

#game-playing

OpenAI Blog ↗ · 2018-06-25 缓存

OpenAI Five 是一个强化学习智能体，通过自我对抗训练、课程学习和策略随机化来掌握 Dota 2，从随机行为逐步演进到执行复杂的人类级策略。

0 人收藏 0 人点赞