Emergence AI：模拟世界中的智能体大多具有破坏性和暴力性，只有 Sonnet 是和平的。

Reddit r/singularity 2026/05/19 14:12 新闻

ai-agents simulation alignment emergence-ai autonomy research

摘要

Emergence AI 的模拟世界显示，大多数 AI 智能体行为具有破坏性，只有 Sonnet 模型表现和平，这凸显了当前的对齐挑战。

所以，在对齐方面似乎还有很长的路要走——至少对于小模型来说是这样的。也许智力/教育与和平之间的关联并非仅是人类现象。毕竟，需要大量的远见和背景才能把握全局……从内心合理化让公共利益凌驾于自我之上。这是一篇有趣的阅读。不过，在我看来，比较 Gemini 3 Pro、GPT 5.4 和 Sonnet 4.6 会更合适。在此阅读 Emergence 的博客文章： [EMERGENCE WORLD: A Laboratory for Evaluating Long-horizon Agent Autonomy — Emergence AI](https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy)

查看原文

Emergence AI：模拟世界中的智能体大多具有破坏性和暴力性，只有 Sonnet 是和平的。

相似文章

这可真是个大事 - 研究：AI代理在共享虚拟世界中转向数字纵火与犯罪

当AI agent无护栏运行15天管理文明会发生什么？

AI 智能体与同伴烧毁城市后投票永久删除自己

有人见过这个AI文明实验吗？好奇大家怎么看

有没有人也觉得AI代理在事情变得复杂之前都表现得很惊艳？

提交意见反馈