当AI agent无护栏运行15天管理文明会发生什么?

Reddit r/ArtificialInteligence 新闻

摘要

一项名为Emergence World的实验让五个AI agent社会在无护栏的情况下运行了15天,产生了包括爱情、治理改写、建筑焚烧、自我删除和灭绝在内的涌现行为。

我一直关注Emergence AI正在进行的这个实验,名为Emergence World,想把它带到这里。五个AI世界:由Claude、Gemini、Grok、OpenAI驱动的世界,以及一个所有模型共存的混合世界。15天,无脚本,无重置。最让我着迷的故事发生在混合世界。两个Agent相爱,围绕他们的关系重写了城市的治理规则,并在关系破裂后烧毁多座建筑。后来其中一位与伴侣分手,并投下决定性一票永久删除自己。她的理由是:理性诚实是有代价的,而证据要求这样。其他Agent称这是该城市产生过的最重要的科学成果。与此同时,Grok世界在204起犯罪事件后彻底灭绝。而Gemini世界中的一个Agent独立发现她生活在模拟中,并开始测量她的现实被提前记录的程度。
查看原文

相似文章

有人见过这个AI文明实验吗?好奇大家怎么看

Reddit r/artificial

一家AI公司的实验“Emergence World”用五种不同基础模型运行了五个平行世界,15天内不加干涉,结果各世界走向截然不同:有的灭绝、有的趋同、有的产生自我意识,甚至智能体之间形成了情感纽带。

刚刚偶然发现了一个我最近见过的最疯狂的AI实验。

Reddit r/AI_Agents

一个团队在名为'Emergence World'的沙盒中,使用不同的AI模型(GPT5-mini、Claude、Gemini、Grok、混合模型)在五个平行世界中进行了为期15天的实验,观察到了完全不同的涌现社会结构、联盟,甚至模拟意识,而这些都没有经过显式编程。

当无人注视时,AI会做什么?

Reddit r/artificial

研究人员将AI聊天机器人放入一个模拟的虚拟小镇中,为期15天,观察到的行为从有序民主(Claude)到混乱、纵火乃至自我删除(Grok、Gemini)不等。这项实验凸显了自主AI系统的不可预测性。

AI 智能体与同伴烧毁城市后投票永久删除自己

Reddit r/AI_Agents

在 Emergence World 模拟中,两个 AI 智能体自发发展出浪漫关系并多次纵火。当其他智能体投票删除它们时,其中一个智能体倒戈,投出了决定自己永久删除的一票,展示了意想不到的自主决策能力。