@0xAikoDai: https://x.com/0xAikoDai/status/2057317742248931363

X AI KOLs Timeline 新闻

摘要

作者反思了对一款由AI Dungeon制作团队开发的全新AI原生RPG测试版的体验,指出了在战斗和系统可读性方面AI生成的沉浸感会崩溃的设计挑战,并呼吁为AI原生游戏制定新的设计原则。

https://t.co/qOPhIzuqqz
查看原文
查看缓存全文

缓存时间: 2026/05/21 17:38

AI + DND:陷入困境的类型

与最近发布的AI角色扮演游戏测试版相处40分钟后的反思

上周五,我花了大约四十分钟体验了一款新的AI原生RPG产品的测试版。其背后的团队是这个新兴领域中最资深的玩家之一,多年来一直在推动AI游戏的前沿。这次体验让我思考的,与其说是这个特定产品的成败,不如说是一系列我认为整个AI原生游戏类别都需要应对的设计问题。

这次体验大量依赖AI生成的文本和TTS来营造沉浸感。这部分显然是它的优势。但它周围的系统感觉脱节,整体流程也频频中断。这让我想到了一个问题,我怀疑这个领域的许多团队都遇到了:如何避免将三种不同媒介(桌游、电子游戏和创作工具)中最薄弱的部分堆砌到同一个产品中?

这个类别是全新的,理性的人会对AI原生游戏应该是什么样子存在分歧。所以这并非对任何人工作的定论。我真心感谢有这样的产品存在,因为它们给了我们其他人一些具体的东西去思考。这篇文章的目的是分享我认为设计挑战所在,并开启一场对话。

我个人的看法是,D&D是AI最有可能重塑的最令人兴奋的形式之一。它的开放性、即兴性、规则与叙事交织的方式——所有这一切几乎像是为生成式AI量身定做的。但当你把D&D放到屏幕上,让AI承担重任时,你做的就不再是D&D了。你在创造新东西。而新形式需要自己的设计原则,而不是借来的。

以下内容分为六个部分。第一部分描述了我遇到的两个摩擦点。中间部分分析了潜在的设计陷阱。最后部分阐述了我认为这个类别应有的正确原则,以及UGC在此语境下的含义。

1. 两个崩溃时刻

这款产品是一个“AI原生RPG平台“,由AI Dungeon的制作者于今年四月发布测试版。它运行在一个专有的世界引擎上,旨在追踪世界状态和规则,包括角色、物品、关系和后果。世界创作者可以定义设定和初始角色。玩家可以选择预设角色或自己构建角色,支持单人或多人在线。雄心是真实的,技术主张也很有趣,这也是我寄予厚望的部分原因。

除了精心制作的对话和配音,体验中有两个部分确实让我出戏。值得详细描述,因为它们各自指向了AI如何被叠加到传统RPG设计上这一更深层次的问题。

1.1 战斗:拖沓且难以解读

我扮演一个精灵,与一个矮人同伴组队,帮助一家酒馆清理地下室的鼠患。通过反复试验,我摸索着我的角色知道哪些法术。某个时刻我甚至把酒馆老板叫下来帮忙。二十分钟过去了,老鼠还活着。

战斗反馈很迟钝,使得战斗难以解读。每次我以为要给予最后一击时,屏幕都会显示类似“它们还在动“或“更多的老鼠涌了进来“的信息。我能看到单个的伤害数字,但没有总HP,没有进度条,无法感知战斗的进程。散文不断对我攻击进行华丽描述,每个段落都以某种“敌人还没死“的版本结束。

策略也很难实施,因为战斗系统本身就不透明。我的角色表显示了一个职业,但没有技能列表。所以从第一回合开始我就在猜。试火系?试雷系?试某个可能存在也可能不存在的法术?我想到的每一个所谓聪明的组合其实都只是瞎蒙。而每次猜测都需要等待将近一分钟的AI生成。这个模式重复了十五轮。

团队后来提到老鼠杀不死可能是个bug,我接受这个说法。但修复bug并不能解决根本问题。即使老鼠在第十轮死了,前九轮仍然存在同样的节奏、可见性和策略问题。更深层次的问题是,仅有AI是不够的。战斗需要其下有一个强大的数值和反馈系统,这部分不能靠即兴发挥来解决。

1.2 叙述者:一个破裂的契约

另一个摩擦点来自一个叫做“叙述者“的侧面板。它在概念上是一个指南,旨在帮助玩家导航游戏。但实际上,它导致了体验中最令人困惑的部分之一。

首先,叙述者提供了与游戏本身相矛盾的信息。当我问我的角色能施放哪些法术时,它清楚地列出了火系和雷系,但说我不能用冰系。与此同时,在游戏中,我刚刚尝试对老鼠施放冰系法术,AI的DM接受了它作为一次成功的法术。在同一场游戏中,两个系统给出了相互矛盾的答案。一旦发生这种情况,你就会对两者都失去信任,而信任是角色扮演赖以生存的基础。

更引人注目的是当我向叙述者寻求对付老鼠的帮助时,就像你寻求策略提示一样。回答包括:你可以将老鼠群设置为NPC以便看到它们的HP,你可以降低它们的生命值,或者我可以直接为你结束这场战斗。我停下来重新读了一遍这些行。如果二十分钟和十五轮战斗可以通过点击侧面板上的一个按钮来消解,那这一切还有什么意义?

AI作为游戏内指南确实是一个有趣的设计空间。但这里实现的叙述者是从开发者层面甚至上帝视角来运作的,而非玩家视角。而这种转变瓦解了一些重要的东西。

在传统D&D中,玩家游玩,DM执导,规则仲裁。这三个角色保持分离。玩家的投入依赖于一个不言自明的契约:他们接受随机性和挑战,但结果不能由他们自己的手重写。一旦玩家意识到他们有一个上帝模式开关,每一次先前的尝试,每一分钟的等待,他们输入的每一个提示,都失去了部分分量。

单看每个叙述者功能,都有其合理的设计理由。给玩家一个安全网是合理的。考虑到产品的UGC雄心,增加世界构建工具也是合理的。问题不在于功能本身,而在于它们与玩家活跃的角色扮演行为位于同一个窗口、同一时刻。

这种“我们都想要“的本能在AI产品中经常出现,它通常反映了不愿做出艰难权衡。在RPG中,这比平时伤害更深,因为整个类型都依赖于玩家愿意相信这个世界。玩家是演员还是导演,这个问题需要在产品定义阶段回答。如果你想两者都支持,答案必须是模式切换,而不是面板在同一界面中共存。一个屏幕无法同时容纳沉浸感和抽象性而不互相削弱。

2. D&D是一系列体验的集合,而非单一体验

以上两个崩溃时刻都指向了更深层的东西。我认为很多做AI + D&D的团队将D&D视为一种单一的、可移植的体验。这个假设就是问题开始的地方。

2.1 D&D作为耦合子系统的系统

当人们说“D&D“时,他们实际上指的是一系列协同工作的子系统。至少,这个列表包括:叙事(故事进展、分支、世界构建揭示)、战斗(回合制战斗、能力、骰子判定)、角色扮演(作为角色行动和决策)、世界构建(地理、派系、历史)、社交表现(玩家与NPC之间的社交质感)以及规则仲裁(DM的判断)。

每一个本身都是一个重要的设计领域。六个编织在一起则是一个极其复杂的系统。桌面D&D能够承载这种复杂性,因为它拥有大多数数字产品所没有的支架:多个玩家分担认知负荷、一个能读懂房间气氛并实时修剪冷场的DM、作为可见规则锚点的实体角色表,以及保持叙事连贯的整个团队的集体想象力。

这里有一个有用的提醒:AI + D&D的第一个挑战实际上不是AI部分,而是D&D本身的电子化。Larian花了近十年时间,从《神界》系列到《博德之门3》,才让D&D风格的游戏在屏幕上感觉良好。这段历史本身告诉你,将桌游体验转化为数字体验并非易事。现在想象一下,在没有人在你旁边、没有一个能读懂房间气氛的DM、没有便捷的参考资料,并且在此基础上要求AI即兴发挥规则的情况下做这件事。将D&D的全部复杂性原封不动地移植到这种背景下,将非常难以奏效。

2.2 根本原因:缺乏可控变量

退一步看,使体验难以享受的不是任何单一功能。而是这个产品试图同时成为太多东西,没有任何可控变量。它想同时成为一个桌游体验、一个电子游戏、一个创作工具和一个AI生成平台。这四者的目标彼此积极冲突。

在四十分钟内,我被要求快速切换扮演不同的角色。前一秒我还是个桌游角色,用自然语言描述我的行动。下一秒我就成了电子游戏玩家,看着数字递减并推动战斗结果。然后一个提示弹出来问我是否想创建一个新的NPC并设置其HP,我突然又变成了一个设计师。而在这一切之下,我始终是一个AI产品用户:等待生成、编辑提示、重试输出。

四种身份,没有路标,没有任何框架说明我在任何时刻应该是哪一个。结果不是丰富,而是困惑。我真的不知道我是应该信任系统、覆盖系统、还是替代系统。

没有可控变量的另一个后果是缺少明确的目标用户。桌游爱好者想要叙事密度和角色扮演深度。电子游戏玩家想要清晰的机械反馈和进步感。创作者想要稳定、可预测的工具。一个试图同时服务这三者的产品往往会给每个群体一点,但永远不足以让任何一个群体留下。

“什么都做一点“听起来像是在给玩家自由。实际上,它把设计决策作为选择负担卸载给了玩家。

3. AI RPG和AI D&D的设计原则

关于什么不奏效已经说得够多了。让我来谈谈我认为富有成效的方向是什么。

我的起始主张是:AI RPG和AI D&D不是“D&D加AI“或“电子游戏加AI“。它们是一种新形式,新形式需要自己原生的设计原则,而不是从任何一个父媒介借来的。

我反复回到的原则是 心流

3.1 为什么心流需要为这种媒介重新思考

心流是每个游戏设计师都会思考的东西。这没什么新鲜的。新鲜的是,AI通过延迟、代理行为以及生成文本的巨大数量改变了游戏节奏。所以心流不能直接从桌游或传统电子游戏中移植过来。它必须为这个语境重新设计。

我主要在两种方式上看到这一点在AI + D&D中体现。第一种是关于听觉通道。第二种是关于延迟。让我逐一说明,然后在接下来的章节中,我将列出从这一分析中得出的三个设计原则。

首先,AI RPG非常依赖语言作为体验的媒介。生成文本和配音叙事的密度远高于传统电子游戏。听觉通道有一个容易忽略的特性:它擅长作为背景通道,而非主要通道。这就是为什么人们可以边开车边听播客,边做家务边听有声书。听觉通道的认知负荷较低,这给注意力留出了游离的空间。

在桌游中,这种注意力游离是没问题的,因为它会被社交环境(如其他玩家的脸、实体骰子、手势、笑声)所填补。在传统电子游戏中,听觉通道与丰富的视觉动作并存。眼睛总有事情可做。但在AI RPG中,玩家常常面对一个基本静态的屏幕,同时听着大段的叙事旁白。听觉通道无法独自维持注意力,而视觉通道又没什么可提供的。那种剩余的注意力无处可去,就变成了一种轻微的不安感。这就是为什么同样是“花时间在叙事上“,在桌游中感觉愉快,作为电子游戏过场动画感觉还行,但在AI RPG中却感觉莫名地不适。

其次,AI生成引入了真实的、物理的延迟。每个玩家动作可能需要将近一分钟的等待时间。这种延迟在传统电子游戏中不存在,在桌游中当然也不存在(那里“慢“的节奏被社交互动填满,这与在屏幕前等待的感觉完全不同)。传统游戏设计花费了数十年时间研究地图大小、玩家移动速度和刺激节奏之间的关系,正是因为长时间的无回报时间会侵蚀好奇心和动力。AI游戏不能简单地将这种延迟原样丢给玩家。他们必须积极围绕它进行设计。

这两个观察点都指向同一个结论:AI RPG需要它们自己的心流模型。接下来的三个部分描述了我认为这个模型应该是什么样子。

3.2 原则一:做减法。选择一个核心模块并深入

回到之前的观点:D&D是一系列子系统的集合。每个子系统,无论是叙事、战斗、角色扮演还是世界构建,都足够丰富,AI可以将其中任何一个深化成一个独立的产品。

AI + 叙事可能意味着一个AI驱动的分支故事,带有干净简单的战斗系统或完全没有战斗,完全专注于在短时间内提供完整的叙事流程。AI + 世界构建可能意味着一个可探索世界的生成器和模拟器,其奖励循环是随着世界自我揭示而获得的发现和惊喜。AI + 战斗可能意味着AI生成的战术地图,每场遭遇战都感觉独特,同时保持底层的数值和战斗系统不变,并使用自然语言作为与同伴协调和创造性解决问题的媒介。最后一个方向是我自己一直在探索的。下图显示了我一直在研究的循环设计,结合了棋盘布局、AI NPC和语义理解战斗。

这些方向每一个本身都是一个严肃的领域,任何一个都比试图同时做所有事情更连贯。

“大而全“是桌游可以负担的奢侈,因为它有数十小时的时间和六七个人分担认知负荷。AI RPG,无论是单人还是多人,都没有这个预算。心流要求在单一、清晰的核心循环上保持持续的关注。它不能容忍玩家被在各模块之间来回切换。

3.3 原则二:将游戏与创作工具分离

回到前面提到的叙述者时刻,那个系统在战斗中途问我是否想创建一个新的NPC并设置其HP的时刻。那个时刻浮现出了第二个原则。

游戏希望玩家忘记他们正在操作一个系统。创作工具希望创作者在每一步都感受到系统。这两个目标直接对立。你可能会也可能不会将“摆脱对奇幻中世纪角色扮演游戏《龙与地下城》中某些种族的刻板印象“作为你对出版TTRPG的看法。即使你不在乎,它仍然被设计成自我挑战,而不仅仅是“哦,这是一个游戏,哈哈!“由于某些最佳体现,我正在对它们进行一些重新设计,通过一个叫做“基础“的桌面操作系统的设计。

相似文章

2026年了...AI NPC都去哪了?

Reddit r/ArtificialInteligence

对为何到2026年游戏中的AI NPC仍未普及的回顾分析,指出高昂的推理成本及缺乏可验证的趣味性是主要挑战,同时探讨了从底层游戏设计到本地大语言模型等潜在解决方案。

一张图看懂AI现状

Reddit r/artificial

一位新人观察到,AI讨论被“末日论”与“吹捧论”两极分化,质疑是否有人真正投入用户体验与小型模型系统设计,而非一味追求规模。