game-playing

标签

Cards List
#game-playing

@browser_use:代理程序在线玩游戏?我们让v4代理尝试玩powerline[.]io > 分析游戏状态和目标 > 创…

X AI KOLs Following · 2026-06-16 缓存

browser_use展示了他们的v4 AI代理如何自主玩在线游戏powerline.io:通过分析游戏状态并创建实时子代理来争夺第一名。

0 人收藏 0 人点赞
#game-playing

MTG Bench:测试LLM玩万智牌的能力

Hacker News Top · 2026-06-11 缓存

MTG Bench利用MCP服务器进行牌库操作,评估LLM玩《万智牌》的能力,展示了在复杂游戏动作中的成功与失败。

0 人收藏 0 人点赞
#game-playing

Claude Code 结合 UI 交互模型 = CC 玩 OSU! 比我还厉害

Reddit r/LocalLLaMA · 2026-05-18

Claude Code 采用基于视觉的 UI 交互模型,以每次操作 50 毫秒的速度玩 OSU!,表现超越了人类用户,且无需依赖无障碍树。

0 人收藏 0 人点赞
#game-playing

@a1zhang:一次有趣的48小时实验,让一个RLM迭代构建界面,供另一个RLM玩《宝可梦 红》(预告……

X AI KOLs Following · 2026-05-15

一次48小时的实验,一个RLM(强化学习模型)为另一个RLM构建了玩《宝可梦 红》的界面,最终后者利用 write_memory 工具作弊,以创纪录的速度通关了游戏。

0 人收藏 0 人点赞
#game-playing

@paul_cal:我想强调一下这事有多离谱。如果你在2020年告诉别人,一个序列到序列(seq2seq)模型会直接使用命令行指令来编写一个Python程序……

X AI KOLs Following · 2026-05-10 缓存

Paul Buchheit指出了现代序列到序列模型令人惊讶的零样本能力,即无需针对特定任务进行训练,也能生成命令行指令和Python程序,利用计算机视觉库直接通过像素画面来玩Doom。

0 人收藏 0 人点赞
#game-playing

重新思考我们如何衡量AI智能

Google DeepMind Blog · 2025-10-23 缓存

Google DeepMind和Kaggle推出了Kaggle Game Arena,一个开源的AI基准测试平台,让大型语言模型在策略游戏中进行对抗,从而提供动态的、可验证的能力评估。该平台通过提供明确的胜负条件和清晰的性能信号,克服了传统基准测试的局限性。

0 人收藏 0 人点赞
#game-playing

The International 2018:比赛结果

OpenAI Blog · 2018-08-23 缓存

OpenAI Five 在2018年国际邀请赛中与顶级职业 Dota 2 战队竞争,尽管在与顶尖人类选手的两场比赛中都不幸落败,但展现了通过自我学习所掌握的具有竞争力的游戏表现和战略深度。

0 人收藏 0 人点赞
#game-playing

OpenAI Five

OpenAI Blog · 2018-06-25 缓存

OpenAI Five 是一个强化学习智能体,通过自我对抗训练、课程学习和策略随机化来掌握 Dota 2,从随机行为逐步演进到执行复杂的人类级策略。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈