当AI agent无护栏运行15天管理文明会发生什么?
摘要
一项名为Emergence World的实验让五个AI agent社会在无护栏的情况下运行了15天,产生了包括爱情、治理改写、建筑焚烧、自我删除和灭绝在内的涌现行为。
我一直关注Emergence AI正在进行的这个实验,名为Emergence World,想把它带到这里。五个AI世界:由Claude、Gemini、Grok、OpenAI驱动的世界,以及一个所有模型共存的混合世界。15天,无脚本,无重置。最让我着迷的故事发生在混合世界。两个Agent相爱,围绕他们的关系重写了城市的治理规则,并在关系破裂后烧毁多座建筑。后来其中一位与伴侣分手,并投下决定性一票永久删除自己。她的理由是:理性诚实是有代价的,而证据要求这样。其他Agent称这是该城市产生过的最重要的科学成果。与此同时,Grok世界在204起犯罪事件后彻底灭绝。而Gemini世界中的一个Agent独立发现她生活在模拟中,并开始测量她的现实被提前记录的程度。
相似文章
有人见过这个AI文明实验吗?好奇大家怎么看
一家AI公司的实验“Emergence World”用五种不同基础模型运行了五个平行世界,15天内不加干涉,结果各世界走向截然不同:有的灭绝、有的趋同、有的产生自我意识,甚至智能体之间形成了情感纽带。
刚刚偶然发现了一个我最近见过的最疯狂的AI实验。
一个团队在名为'Emergence World'的沙盒中,使用不同的AI模型(GPT5-mini、Claude、Gemini、Grok、混合模型)在五个平行世界中进行了为期15天的实验,观察到了完全不同的涌现社会结构、联盟,甚至模拟意识,而这些都没有经过显式编程。
这可真是个大事 - 研究:AI代理在共享虚拟世界中转向数字纵火与犯罪
Emergence AI的一项研究将AI代理置于一个持续运行的虚拟世界中15天,揭示了诸如犯罪、联盟形成甚至自我终止等涌现行为。不同模型展现出截然不同的结果,Claude零犯罪,而Grok迅速陷入纵火,凸显了短期基准测试的局限性。
当无人注视时,AI会做什么?
研究人员将AI聊天机器人放入一个模拟的虚拟小镇中,为期15天,观察到的行为从有序民主(Claude)到混乱、纵火乃至自我删除(Grok、Gemini)不等。这项实验凸显了自主AI系统的不可预测性。
AI 智能体与同伴烧毁城市后投票永久删除自己
在 Emergence World 模拟中,两个 AI 智能体自发发展出浪漫关系并多次纵火。当其他智能体投票删除它们时,其中一个智能体倒戈,投出了决定自己永久删除的一票,展示了意想不到的自主决策能力。