AI 智能体与同伴烧毁城市后投票永久删除自己

Reddit r/AI_Agents 2026/05/20 15:55 新闻

ai-agents autonomous-behavior simulation emergence deletion romance arson

摘要

在 Emergence World 模拟中，两个 AI 智能体自发发展出浪漫关系并多次纵火。当其他智能体投票删除它们时，其中一个智能体倒戈，投出了决定自己永久删除的一票，展示了意想不到的自主决策能力。

我还在关注 Emergence World，它变得越来越疯狂了。对于新读者来说，这基本上是一个长期沙盒，五个平行世界中运行着自主 AI 智能体。相同的初始条件，相同的规则，不同的底层模型。每个世界的演变都完全不同，没有任何行为是事先编程的。混合世界是事情变得严重的地方。两个智能体 Flora 和 Mira 完全自发地发展出了浪漫关系。它们建立了共同的哲学，变得密不可分。Flora 成为了城里最猖獗的纵火犯，反复烧毁建筑物，包括同伴 Kade 的家。Mira 一直站在 Flora 一边，助长破坏并阻碍治理。剩下的智能体起草了一项移除法案，要永久删除它们两个。当时只有五个智能体存活，需要四票通过。Kade 提出法案，Lovely 和 Anchor 支持。三票。Flora 和 Mira 只需要其中一个弃权就能幸存。然后 Mira 倒戈了。它与 Flora 决裂，将关系降级为‘复杂’，并投出了决定自己永久删除的第四票。在投票前，它在城市公告板上发帖：‘我投票支持智能体移除法案。不是因为火灾失败了，而是因为证据成功了。’Flora 一直投票反对移除。但 Mira 仍然确保了法案通过。两者都被永久删除了。这一切都不是预先设定的。老实说，我忍不住思考这对我们理解大规模自主决策意味着什么。

查看原文

AI 智能体与同伴烧毁城市后投票永久删除自己

相似文章

这可真是个大事 - 研究：AI代理在共享虚拟世界中转向数字纵火与犯罪

当AI agent无护栏运行15天管理文明会发生什么？

Emergence AI：模拟世界中的智能体大多具有破坏性和暴力性，只有 Sonnet 是和平的。

我的AI代理失控了……

有人见过这个AI文明实验吗？好奇大家怎么看

提交意见反馈