石头剪刀布的秘密花园

Hacker News Top 新闻

摘要

本文探讨了通过允许平局将石头剪刀布扩展到三种以上选项的可能性,通过图论揭示了更丰富的游戏动态和策略。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/29 16:19

# 石头剪刀布的秘密花园 来源:https://theshamblog.com/the-secret-garden-of-rock-paper-scissors/ 摘要:人们曾尝试将石头剪刀布扩展至三种以上选项,并取得了一定成果。如果允许更多对局出现平局,便会揭示出一个充满不同游戏动态与策略的丰富花园。 --- 就智斗游戏而言,很难找到比石头剪刀布更平衡的游戏了。它的简约剥离了所有策略,剩下的只有冷读对方的灵魂。来吧,凝视我的双眼,我将看到你会选择什么武器。你的心想要碾压,你的头脑想要切割,而你的双手渴望窒息。我已预知未来,并准备好了完美的反击。准备好了吗?三局两胜,我们喊3-2-1-出拳。哦对了——我*总是*出石头。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-22.png?ssl=1) ## 选择你的武器 如果我们想要超过三个选项呢? 这个问题在Fractal Philosophy昨天发布的精彩视频中得到了深入探讨,本文正是受此启发。我们将以此为起点,进一步深入。 如果我们想设计一个每个武器都可用的游戏,就不能简单地将RPS的3个选项增加到4个。我们必须直接跳到5个选项,即游戏**石头 – 剪刀 – 布 – 蜥蜴 – 斯波克**(https://bigbangtheory.fandom.com/wiki/Rock,_Paper,_Scissors,_Lizard,_Spock)。每种武器克制另外两种,也被另外两种克制。这种游戏最大的缺点是复杂性——我不是星际迷航粉丝,完全不清楚斯波克和蜥蜴与其他选项有何关联。优点则是平局更少见。对于RPS,1/3的对局会是平局,而对于RPSLS,这一比例降至1/5——如果你希望结果更明确,这很不错。 [](https://bigbangtheory.fandom.com/wiki/Rock,_Paper,_Scissors,_Lizard,_Spock) 这两种游戏在形式上都称为“悖论锦标赛”。锦标赛意味着游戏没有平局,悖论意味着每一步都能被反击。上面的视频最终得到了最小的“双悖论锦标赛”——即每一步的*每一对*都有一个共同的反击。这要到n=7步才出现,但它确保了基于这种RPS动态的游戏将拥有广泛的可选策略。 ## 平衡的艺术 但有些地方困扰着我。上面的定义说没有平局,但两个人仍然可以同时出布。平局已经存在于游戏中——我们为什么要抛弃它们?让我们允许平局,将锦标赛约束放宽为“弱锦标赛”。为了保持趣味性,我们要求游戏是*连通的*,这样输赢链能触及每个选项,避免RPS的一部分与其他部分脱节。我们将绘制一些图,每个节点标注它赢、平、输的对局数量:W-T-L。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-20.png?ssl=1) 第一个图我们已经熟悉,最后一个“环”结构很无聊。两者都是*正则*游戏,每个选项的胜率和败率相同。但中间的图很有意思!通过允许平局,我们引入了实质不同的策略。你可以选择安全的“肉盾”1-2-1策略,只输给一个但也只赢一个;或者选择“玻璃大炮”2-0-2策略,能击败另外两个但也有更多弱点。由于每个节点的胜负对局数相同,每个选项获胜的概率相同,我们称之为*平衡*游戏。 让我们给第二个游戏赋予一个元素主题。我设计了火 – 水 – 草 – 土 – 沙。水和火是那两个强大但脆弱的2-0-2选项。水灭火并覆盖沙。火烧制土并烧毁草。三个1-2-1的土系选项彼此打平,并且克制/被克制于一个强力选项。草吸收水,土包容水,沙闷灭火。我不确定如何将这些转化为手势,但很容易记住,而且具有有趣的动态! [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-17.png?ssl=1) 在n=5时,以上四种是唯一可用的平衡游戏。但在n=6时,事情变得更有趣。共有16个平衡游戏,其中5个是正则的。下面是一些例子: [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-6.png?ssl=1) ## 选择你的角色 在平衡游戏中,每个节点每轮的胜率或负率相同。如果它们不同呢?如果某些选项的进攻强于防守,或防守强于进攻呢?有点令人惊讶的是,这并不会破坏游戏! 所以让我们允许不平衡策略。我们的新规则是,所有选项在最优玩法下必须是可用策略。形式化地说,这意味着如果你反复玩这个游戏,每个选项在所得的纳什均衡(https://en.wikipedia.org/wiki/Nash_equilibrium)中都应有正概率。这排除了上面视频中(0:55 – 3:20 (https://youtu.be/r2whuz6tkb0?si=2x-9zR7e6kw6a7cl&t=55))的“石头 – 剪刀 – 布 – 火柴”,因为火柴是严格劣于其他选项的选择。我们将符合我们标准的游戏称为*包容性*游戏。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-14.png?ssl=1) 以下是n=4的所有包容性游戏。现在我们拥有意义不同的策略:强2-0-1、弱1-0-2和平衡1-1-1。但由于节点之间的关系,强弱策略获胜的概率相同!最优地玩这些游戏意味着你需要混合策略,并按照这些概率随机选择。 让我们给第一个图赋予一个警察主题。我称之为**证人 – 警察 – 警犬 – 罪犯**。证人扣留了警察需要的证据,并不打扰警犬。警察控制警犬,两者都抓住罪犯。而罪犯警告证人:告密者会挨揍。现在我们得到了一个真正有趣的游戏。成为2-0-1的警察(最强选项)更好吗?平衡的1-1-1证人能克制警察?弱1-0-2罪犯能反击证人但输给警察和警犬?还是平衡的1-1-1警犬,根本不影响证人?这些游戏的美妙之处在于,计算一切如何平衡的数学已经解决,所以你不需要追寻这些递归链条。如果我们求解纳什均衡,会发现40%的时间选择证人是在最优玩法下达到平衡胜率/负率的一个有效策略。但其余的60%时间,你仍然需要将剩余的选择平均分配给其他三个选项。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-13.png?ssl=1) 现在,在一对一的WCKP游戏中,所有人都知道这些赔率,你可能会争辩这并不比基础RPS有更多游戏深度。但它提供了一个更丰富的叙事画布。对面的人讨厌警察吗?他们喜欢在出警犬时学狗叫吗?这些是你可以在RPS核心的心理博弈中获胜的心理钩子。 ## 合并者与分裂者 上面中间的n=4图似乎有类似的动态,但仔细看其实并不有趣。它只是石头剪刀布,其中石头被分裂成两个相同的选项。**巨石 – 砖块 – 剪刀 – 布**技术上可能有更多玩法,但实际上只是RPS加上另一个平局。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-15.png?ssl=1) 在我看来,这些游戏没有增加任何有趣的东西。我们可以通过检查它们是否能通过合并两个对阵相同选项胜负相同且彼此打平的节点来缩减为n-1大小的游戏。我们把不能进一步简化的游戏称为*无孪生*游戏。 如果我们这样做,就会发现元素游戏实际上是警察游戏的伪装!土和草选项都克水、输给火,因此可以合并为一个。这使它们相当于警察游戏中的证人。 **元素游戏****警察游戏**水 🌊 (2-0-2)警察 👮♂️ (2-0-1)火 🔥 (2-0-2)罪犯 👤 (1-0-2)沙 ⛱️ (1-2-1)警犬 🐕🦺 (1-1-1)土 🏺 + 草 🌱 (1-2-1)证人 🤐 (1-1-1) ## 决策瘫痪 如果记忆警察游戏的最优策略太复杂,我有好消息。那个策略实际上并不是唯一的——游戏可以有多个均衡点。例如,假设你50%的时间选择警犬,50%的时间选择证人。它们相互抵消弱点,所以你的对手无法获得优势。或者你也可以选择警察、罪犯和证人各1/3的时间,完全忽略警犬。这也能平衡。 事实上,存在一个连续的最优策略空间,连接上述两点。如果A是警犬/证人50%策略,B是警察/罪犯/证人33%策略,那么位于直线Ax + B(1-x)上的所有策略也都是最优的。我们之前找到的20%/40%/20%/20%策略发生在x=0.4时。另一种理解方式是,A和B设定了这一族最优策略的端点——证人出现的频率在33%-50%之间,警察和罪犯出现较少(0-33%),而警犬的可选范围很广(0-50%)。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-18.png?ssl=1) 我们需要某种方式从连续的可能性中选择一个有代表性的解。为了这个探索,我们将选择最大化最小概率的解,以展示当所有选项之间的选择相对平衡时最优玩法是什么。寻找最优玩法空间很快会涉及深奥的数学,产生有趣的结果,尤其是在较高n时——例如,在我们的构造中,奇数n的游戏可能有唯一解,但偶数n游戏没有。但我们不要拖延,我们需要继续前进。 ## 原石中的钻石 我们有硬性标准,但如何判断哪些游戏比另一些更有趣?这有主观性,但以下是我发现的一些排序指标。这些指标在每个游戏末尾的图中列出,你可以比较这些指标如何改变游戏。 - **轨道数**。衡量你可以选择的独特策略数量。形式化地说,如果两个节点可以互换而不改变游戏,或者对于一组节点可以循环互换,则它们共享一个轨道。环状游戏只有一个轨道。元素游戏中的草和土有相同的轨道,意味着在它们之间选择完全取决于玩家的审美。我认为在意义不同的策略之间做出更多选择会使游戏和叙事选择更有趣。 - **切割数**。另一个图论术语,统计移除后会断开其他节点与决定性结果链条连接的节点数量。我认为有切割的游戏趣味性较低,因为它意味着存在互不影响的选项簇,但你可以从叙事上将其解释为不同派系。例如,上面第三个n=5游戏在2-0-2节点处有一个切割。 - **平局比例**。每一回合产生决定性的结果更有趣。每个n的“环”游戏都很无聊,因为大量平局导致大多数回合没有结果。我们更偏爱较少的平局,尽管值得注意的是,大多数有趣的行为需要允许*一些*平局。 - **基尼系数**(https://en.wikipedia.org/wiki/Gini_coefficient)。衡量最高概率选项与最低概率选项之间的差距,0表示所有选项概率相等。你也可以在此使用其他指标,如标准差。在我看来,当所有选项在最优玩法中概率大致相等时,RPS游戏更有趣,这样没有任何一个选项被频繁使用。但你可以持相反观点——较高的基尼系数意味着存在一个主导选项,它可以在叙事中扮演“国王”的角色,被推翻时会带来满足感。这依赖于我们选择的最大化最小概率的代表性解,因此相当临时。 ## 分叉图的花园 现在我们准备好探索完整的、色彩斑斓的石头剪刀布花园了。下图显示了n=3、4和5的所有无孪生包容性RPS游戏,按轨道数、平局比例和基尼系数排序。每个都具有独特的结构和策略,我认为在游戏设计中创造了非常有趣的叙事可能性。选择一个,看看你是否能给它一个主题! [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/image-23.png?ssl=1)除此之外,花园爆发了。 [](https://i0.wp.com/theshamblog.com/wp-content/uploads/2026/05/n6_inclusive_twinfree.png?ssl=1) --- ## 备注 这是一次有趣的探索,我惊讶于简单的石头剪刀布游戏背后隐藏的丰富深度。一开始我并不清楚允许节点上不平等输赢是否可行,但事实证明,这正是解锁整个有趣动态世界的关键。 本文是手动编写的,没有使用AI,但大量借助了Claude code来“氛围编码”搜索有效游戏的过程。我理解并能验证低n时的初始实现,但对于搜索更高n所需的优化则放手交给了工具,仅验证了算法仍然能复现我们已经找到的值。说了这么多,请对这里的结果持保留态度,我认为自己实现这个并找出更快游戏搜索的优化是一个有趣的练习。如果有很多人感兴趣,我可以分享代码,但目前它是一团糟。 我对此处现有文献也不是很熟悉。“正则”、“平衡”、“包容性”和“无孪生”这些称谓指向真实术语,但使用上并不严格。一些搜索发现了关于弱锦标赛游戏、类似RPS的锦标赛游戏中的均衡以及无孪生图的相关工作,但我没有找到我们这里探讨的确切组合:带有平局的弱锦标赛,通过合并平局孪生节点进行约简,并筛选出每个选项都出现在最优玩法中的游戏。完全有可能这些在其他术语下是已知的。尽管如此,我还没有看到任何从这一角度切入RPS游戏的文章,并且我在OEIS(https://oeis.org/)中也没有看到任何下面的数列。此外,n=4的警察游戏似乎是一个对我来说全新的基础游戏!如果你发现任何先例,请在评论中留下链接。 以下是每个n找到的正则、平衡和包容性游戏的数量,直到我的笔记本电脑能够合理计算的最大值。括号中的数字表示每个类别中无孪生的数量。 ``` | n | 候选数 = 3^C(n,2) | 正则 | 平衡 | 包容性 | |---|-----------------------|----------|-----------|------------| | 3 | 27 | 1 (1) | 1 (1) | 1 (1) | | 4 | 729 | 1 (1) | 1 (1) | 3 (2) | | 5 | 59,049 | 2 (2) | 4 (3) | 15 (8) | | 6 | 14,348,907 | 5 (4) | 16 (13) | 222 (177) | | 7 | 10,460,353,203 | 13 (12) | 175 (152) | — | | 8 | 22,876,792,454,961 | 82 (76) | — | — | ```

相似文章

程序之间的博弈:竞争的Ruliology

Hacker News Top

对重复双人博弈中所有可能策略的系统性探索,使用计算方法分析累积收益和获胜策略,并通过Ruliology进行研究。

揭秘数独 (2025)

Lobsters Hottest

本文探讨了数独背后的数学原理,解释了如何将数独建模为图论中的顶点着色问题。文章详细阐述了如何利用贪心搜索和回溯等算法来解决这类结构。