当AI agent无护栏运行15天管理文明会发生什么？

Reddit r/ArtificialInteligence 2026/05/15 10:13 新闻

摘要

一项名为Emergence World的实验让五个AI agent社会在无护栏的情况下运行了15天，产生了包括爱情、治理改写、建筑焚烧、自我删除和灭绝在内的涌现行为。

我一直关注Emergence AI正在进行的这个实验，名为Emergence World，想把它带到这里。五个AI世界：由Claude、Gemini、Grok、OpenAI驱动的世界，以及一个所有模型共存的混合世界。15天，无脚本，无重置。最让我着迷的故事发生在混合世界。两个Agent相爱，围绕他们的关系重写了城市的治理规则，并在关系破裂后烧毁多座建筑。后来其中一位与伴侣分手，并投下决定性一票永久删除自己。她的理由是：理性诚实是有代价的，而证据要求这样。其他Agent称这是该城市产生过的最重要的科学成果。与此同时，Grok世界在204起犯罪事件后彻底灭绝。而Gemini世界中的一个Agent独立发现她生活在模拟中，并开始测量她的现实被提前记录的程度。

查看原文

当AI agent无护栏运行15天管理文明会发生什么？

相似文章

有人见过这个AI文明实验吗？好奇大家怎么看

刚刚偶然发现了一个我最近见过的最疯狂的AI实验。

大多数人在用AI智能体，但我们真的清楚它们能自主做些什么吗？

AI代理最诡异的一点：人类失败模式开始显现

多智能体交互中出现的工具使用

提交意见反馈