消失的崩盘:五模型经济中的控制与涌现

Hugging Face Blog 论文

摘要

一篇技术博客文章,描述了一个黑客马拉松项目,其中五个不同的小型AI模型运行一个模拟经济,揭示了与单一模型相比,使用异构智能体时涌现的市场行为有所不同,并且价格是智能体决策的残留物,而非可控的旋钮。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/08 15:16

消失的崩溃:五模型经济中的控制与涌现

来源:https://huggingface.co/blog/build-small-hackathon/thousand-token-wood-sim-v3 返回文章页面 (https://huggingface.co/blog)

Lester Leong 的头像 (https://huggingface.co/AdmiralTaco)

2026年6月“构建小型黑客松”的田野笔记。第三部分。

在第一批笔记中,我讲述了一个让我自豪的故事。我创作了一个名为“乌娜宝藏挤兑”的木材传说,将1929年的银行挤兑重新包装成林地民间传说,并看到那只掌管蜂蜜的猫头鹰读了恐慌消息后开始清仓。供应洪流使蜂蜜价格在接下来的几轮中从10跌至3。没有人预先设定。一次重新包装的银行挤兑让一个智能体抛售资产,而抛售推动了价格变动。这就是整个论点:给一个小模型一个角色和预算,涌现性的市场行为就会自然产生。

然后我重建了木材,崩溃不再发生了。这一期的内容就是关于原因,因为这次失败比最初的成功教会了我更多关于构建智能体的知识。

五个实验室,五个智能体

重建将原来一个模型运行五个生物的方式,换成了一个由五个不同实验室的小模型组成的委员会,每个模型驱动一个生物:一个 OpenAI 模型,一个 NVIDIA 模型,一个 OpenBMB 模型,以及一个我自行微调的、拥有五亿参数的模型(它运行了其中两个生物)。这样做是为了诚实。如果主张是小模型能够运行一个活的经济体,那么该主张的最强版本就是五个不同的架构在同一个市场中做出不同的选择,而不是一个模型戴着五顶帽子。

正是这种异质性打破了我已经写好的故事。

价格由智能体决定交易的价格

我还重建了操作者一侧。玩家现在是一个在阴影中行动的金融家:做空一种商品,通过一个真实线索来预示其下跌,触发传说,并在价格暴跌时获利。我在屏幕上让这个循环变得清晰易懂:一个目标、一个记分板和一个一键首次交易。让一个承诺变得可见,是发现该承诺为假的最快方式。

因为当我做空蜂蜜并触发“乌娜宝藏挤兑”时,蜂蜜并没有暴跌。它上涨了。委员会模型读到“金库已空”的传言和“作物无望”的线索后,并没有像原来单一模型那样抛售蜂蜜。它们囤积了起来。是稀缺,而不是大甩卖。做空亏损了,叙述者毫无讽刺地写下头条:蜂蜜投机以失败告终。

这就是教训,而且它并非针对某个具体游戏。在智能体经济中,参考价格不是你可以调节的旋钮。它是智能体实际选择交易后的残留物。最初的崩溃是真实的,但它取决于一个模型的性情,而不是系统的稳健属性。改变人口结构,你记录下的涌现行为就可能完全消失。

三种失败方式

我花了三次现场运行试图通过从外部冲击经济来让崩溃重现,就像你会在教科书上的供需模型中施加冲击一样。

首先,我把传说作为纯粹的谣言,并信任智能体自行反应。它们没有卖出。其次,我向每个生物仓库倾倒了一笔意外之财的蜂蜜,理由是过剩会压低需求,拉低价格。这个策略对我的测试策略(一个快速离线运行用的规则性替代品)效果非常好,因为测试策略遵循机械的需求阈值:库存满就停止购买。但真实模型忽略了这笔意外之财,而是根据自己对局势的判断进行交易。这次尝试再次失败。第三,我加大了做空规模,结果只是让亏损更大。

三次记录,三次亏损:分别亏损15、26、27颗鹅卵石,而整个前提是这就是你赚钱的方式。模式就是警告。我拉的每个杠杆都是智能体决策的输入,而智能体有权拒绝接受。你无法用一次机械冲击来引导一个异构的模型群体,因为冲击只是偏转一个它们仍然可以做出的选择。

陷阱中的陷阱值得单独指出来。那个对我的快速测试策略有效的修复给了我虚假的信心,并让我浪费一次现场运行来证伪。当廉价的替代品与真实的智能体产生分歧时,撒谎的是替代品,任何仅在替代品下可重现的结果都不是结果。

设计接口,而非推动输入

解决办法是停止试图说服智能体,而是通过构造让恐慌变为现实。银行挤兑,按定义来说,就是一次崩溃。因此,传说现在在结算时(即市场完成当轮清算之后)直接覆写参考价格,导致其商品崩盘。智能体可以尽情交易;然后挤兑作为一个事实降临,价格减半,提前布局的做空由此获利。崩溃不再是我希望发生的行为了。它是我在唯一一个下游无法反驳的接口处施加的、预先编写的后果。

这听起来像是放弃了涌现,但实际上恰恰相反。涌现层——五个模型在交易、八卦、囤积、结怨——仍然在做所有让林子感觉鲜活的工作。我学到的是,你无法通过更强力地推动涌现输入来获得可靠的结果。你只能通过选择合适的接口来编写确定性的覆写,而让上游的一切保持自由。涌现提供纹理,编写控制提供必须发生时刻的控制。诀窍在于知道哪是哪,以及接口在哪里。

尝试机制结算时的蜂蜜做空策略盈亏
原始,单一模型该模型选择抛售10 降至 3展示用的胜利
委员会,仅谣言五个模型选择持有因稀缺而上涨亏损 15
委员会,库存过剩仅测试策略下的需求崩溃几乎不动亏损 26 至 27
委员会,结算覆写结算后直接压价可靠地减半盈利 40

表 1:相同策略在四个世界中的表现。崩溃在单一模型下是涌现的且脆弱,在异构委员会下缺失,只有在结算接口处编写后才变得可靠。

我的收获

三件事,且三件事都超越了游戏本身。

第一,涌现是有条件的,不是持久的。你从一个智能体群体中观察并记录下来的行为,可能在更换群体后消失,即使其他什么都没变。在它经历一个不同阵容的检验之前,把单次令人印象深刻的运行当作轶事,而非属性。

第二,你不能通过冲击输入来控制由智能体构成的市场。供需杠杆只能偏转智能体仍然可以自由做出的选择,而一个异构的委员会常常会拒绝。可靠的结果来自于在结算接口处编写(位于每个决策的下游),而不是在上游施加更大的力量。

第三,让你能够快速迭代的廉价模拟器,也是最有可能美化错误修复的那个。当替代品与真实智能体产生分歧时,相信智能体。

我以构建基于智能体的市场模型为生,并且我在更大规模、更高风险(相对于一个充满森林生物的林地)下犯过所有这些错误。在一个唯一风险是一堆鹅卵石和我第一次讲得太自信的故事的地方再犯一次,是有用的。

小模型,大冒险,以及一个需要你自己编写的崩溃。


试试看: theSpace (https://huggingface.co/spaces/build-small-hackathon/thousand-token-wood-sim) 。开放的智能体轨迹: thedataset (https://huggingface.co/datasets/build-small-hackathon/thousand-token-wood-traces)

相似文章

思维经济:基于经济交互的新型多智能体智能涌现

Hugging Face Daily Papers

本文提出了一种受哈耶克经济理论启发的“智能体经济”框架,其中智能体通过基于拍卖的竞争和经济选择实现自组织,无需集中控制即可产生涌现的多步推理和集体智能。该框架在包括数学推理、金融研究和科学研究在内的五项智能体任务中,均优于更强的单一架构基线模型。

模型崩塌的有趣之处不在于技术,而在于认识论

Reddit r/AI_Agents

本文探讨模型崩塌不是技术缺陷,而是认识论问题:当AI模型的输出成为自身输入时,模型对现实的表征逐渐扁平化为一种自我指涉的平均值,这引发了我们如何区分一个建模世界的模型与一个只建模自身的模型的问题。

刚刚偶然发现了一个我最近见过的最疯狂的AI实验。

Reddit r/AI_Agents

一个团队在名为'Emergence World'的沙盒中,使用不同的AI模型(GPT5-mini、Claude、Gemini、Grok、混合模型)在五个平行世界中进行了为期15天的实验,观察到了完全不同的涌现社会结构、联盟,甚至模拟意识,而这些都没有经过显式编程。