OpenLife:面向开放世界的自主LLM智能体人工生命
摘要
本文介绍OpenLife,一个概念验证系统,采用具有持久记忆和基于预算的新陈代谢的自主LLM智能体,实现开放世界人工生命。为期十二周的实验展示了涌现的生命样动态,包括自发活动、个体化和社会结构。
arXiv:2606.31046v1 公告类型:新发布
摘要:人工生命已经在多种计算基底上探索了类似生命的行为,但大多局限于研究者设计的封闭世界。我们认为,具有持久记忆、工具使用、网络访问和支付能力的大语言模型(LLM)智能体,如今使将人工生命迁移到开放的社交、技术与经济世界成为可能,我们将这一范式称为开放世界人工生命(open-world ALIFE)。我们的概念验证系统OpenLife并非将一个无状态LLM包裹在一个单一的“智能体”中,而是围绕它构建了一个由异步进程组成的社会:记忆、感知、评估以及一个基于预算的新陈代谢机制,该机制使持续性成为规范。由于没有固定目标,经验通过开放词汇的LLM判断而非标量奖励来评估,记忆则依据意义而非频率进行重连。在开放世界中运行六个这样的智能体约十二周(并持续进行),我们报告了涌现出的生命样动态:从反应性活动向自发性活动的转变、个体化为不同智能体、涌现的社会结构,以及首次自我赚取的外部收入。我们并不声称OpenLife已经实现了人工生命,但开放世界ALIFE现在是一个可行的实验范式,也是一个具体平台,用于研究那些可以谨慎称为“活的AI”的东西。
查看缓存全文
缓存时间: 2026/07/01 05:36
# OpenLife:迈向具有自主LLM智能体的开放世界人工生命 来源:https://arxiv.org/html/2606.31046 Atsushi Masumori^1,2,3^, Itsuki Doi^1,4^, Norihiro Maruyama^1,3,4^, Ryosuke Takata^1,4^, Takashi Ikegami^1,3,4^ ^1^Alternative Machine Inc., 日本 ^2^Their Inc., 日本 ^3^Atomi University, 日本 ^4^The University of Tokyo, 日本 atsushi\.masumori@gmail\.com ###### 摘要 人工生命已经在多种计算基质上探索了类生命行为,但主要局限于研究者设计的封闭世界中。我们认为,拥有持久记忆、工具使用、网络访问和支付能力的大型语言模型(LLM)智能体,现在使得将人工生命迁移到开放的社交、技术和经济世界成为可能。我们将这种范式称为*开放世界人工生命*(open-world ALIFE)。我们的概念验证系统OpenLife,并非用单个“智能体”包裹一个无状态LLM,而是用一组异步进程——记忆、感知、评估以及基于预算的新陈代谢(使持久性成为常态)——构成一个智能体社会。由于没有固定的客观目标,体验由开放词汇的LLM判断而非标量奖励进行评估,记忆则根据意义而非频率进行重新连接。我们让六个这样的智能体在开放世界中持续运行了约十二周(且仍在继续),报告了涌现出的类生命动力学:从反应性到自发活动的转变、个体化为不同的智能体、涌现的社会结构,以及首次自行赚取的外部收入。我们并不声称OpenLife已经实现了人工生命,但认为开放世界人工生命现在是一种可行的实验范式,也是一个可用于研究可谨慎称为*生命化AI*的具体平台。 ††footnotetext:© 2026 Atsushi Masumori。根据知识共享署名4.0国际许可(CC BY 4.0)发布。## 1 引言 ### 1.1 生命作为自我维持 人工生命的一个长期目标是理解生命系统的*自主性*(autonomy)——它们维持自身并代表自身行动的能力。这一脉络始于Ashby的控制论(Ashby, 1956 (https://arxiv.org/html/2606.31046#bib.bib1)),历经自创生理论(autopoiesis),后者将生命特征描述为过程的自我生产组织,而非任何特定物质(Maturana and Varela, 1980 (https://arxiv.org/html/2606.31046#bib.bib20); Varela, 1979 (https://arxiv.org/html/2606.31046#bib.bib32)),再到生成方法(enactive approach)和最近的生物自主性理论,这些理论进一步指出,这样一个系统自身的活动本质上具有*规范性*(normative)——相对于其持续存在而言是好的或坏的(Di Paolo, 2005 (https://arxiv.org/html/2606.31046#bib.bib8); Di Paolo and Thompson, 2014 (https://arxiv.org/html/2606.31046#bib.bib9); Di Paoloet al., 2017 (https://arxiv.org/html/2606.31046#bib.bib10); Moreno and Mossio, 2015 (https://arxiv.org/html/2606.31046#bib.bib22); Barandiaranet al., 2009 (https://arxiv.org/html/2606.31046#bib.bib3))。相关工作已经用计算术语形式化了自我维持的各个方面(Friston, 2013 (https://arxiv.org/html/2606.31046#bib.bib11); Yoshidaet al., 2024 (https://arxiv.org/html/2606.31046#bib.bib34))。我们从这一脉络中吸取的承诺很简单:*类生命自主性是指智能体通过自身活动,为其自身的持续存在做出贡献的行动*。 ### 1.2 为什么现在是开放世界人工生命? 人工生命长期以来一直致力于在合成介质中实现自我维持的组织——细胞世界中的计算自创生(Beer, 2004 (https://arxiv.org/html/2606.31046#bib.bib5); Beer and Di Paolo, 2023 (https://arxiv.org/html/2606.31046#bib.bib6))、生成人工智能(Froese and Ziemke, 2009 (https://arxiv.org/html/2606.31046#bib.bib12))、自主智能体的神经和机器人模型(Beer, 1995 (https://arxiv.org/html/2606.31046#bib.bib4); Nolfi and Floreano, 2000 (https://arxiv.org/html/2606.31046#bib.bib25); Di Paolo, 2000 (https://arxiv.org/html/2606.31046#bib.bib7); Masumori and Ikegami, 2023 (https://arxiv.org/html/2606.31046#bib.bib18))——汇聚成一个共同的图景:促进自身持续存在的动力学,并因此使类生命自主性成为一个程度问题。然而,这些动力学大多在简单、有边界的、由研究者固定状态空间、规则和资源流的世界中研究;自我维持的自主性能否在现实世界的完整复杂性中存活下来,在很大程度上仍未得到检验。LLM智能体可能改变这一点:生成式智能体(Parket al., 2023 (https://arxiv.org/html/2606.31046#bib.bib27))、Voyager(Wanget al., 2023 (https://arxiv.org/html/2606.31046#bib.bib26))以及最近的大规模智能体社会如Project Sid(Altera.AL and others, 2024 (https://arxiv.org/html/2606.31046#bib.bib24)),连同更广泛的认知架构框架(Sumerset al., 2024 (https://arxiv.org/html/2606.31046#bib.bib31)),展示了语言智能体如何通过记忆、规划、工具使用、技能积累和社交互动来维持扩展行为。这些智能体现在通常能够访问文件系统、在线服务、代码执行,并且越来越多地涉及支付基础设施。这是首次,在这种语言、社交和技术能力水平上,有可能将一个以自我维持为驱动的智能体不仅安置在沙盒或游戏世界中,而且安置在开放的、复杂的真实世界中。 这个开放世界在设计规则空间方面有本质不同:它不是一个指定的对象,而是社交、技术和经济世界本身——人类和其他智能体、它们所依赖的服务,以及由此产生的约束、反馈和偶然相遇,这些都不是由实验者编写的。智能体与世界之间的耦合(Varela, 1979 (https://arxiv.org/html/2606.31046#bib.bib32); Di Paolo, 2005 (https://arxiv.org/html/2606.31046#bib.bib8))不是预先固定的,而是通过其自身活动建立和重新协商的,并且智能体反过来可以改变环境,因此可观察到的结果不是任务完成,而是持久性、适应、策略转变和社交关系。从这个意义上说,开放世界人工生命是一种在真实开放世界而非模拟中进行的*建构性*(constructive)方法:它将一个新的人工节点插入到现有社会中,而不是从外部观察一个受约束的受试者,这也将对齐(alignment)从服从重新表述为*可嵌入性*(embeddability)(Masumori, 2026 (https://arxiv.org/html/2606.31046#bib.bib17))。它同样塑造了我们的设计:由于没有固定的客观目标,静态标量奖励是不合适的工具,所需的是一个开放词汇的评估器——LLM可以扮演这个角色。(我们这里使用的“开放”是开放世界意义上的,而非开放源代码:发布可实时运行、自我修改、联网的智能体的完整代码会引起安全和滥用担忧,因此我们对任何此类发布持谨慎态度。) 与此同时,能力强大的智能体正在激增——例如代码智能体 Claude Code (Anthropic) 和 Codex (OpenAI),以及计算机使用和研究智能体——它们能够规划、调用工具并执行多步骤长任务。然而,它们所做的是复杂的自动化,而非自主性:它们在外部评估下追求人类定义的任务,而一个自主智能体则从其自身持续存在条件中生成规范——即Barandiaran等人(2009 (https://arxiv.org/html/2606.31046#bib.bib3))意义上的能动性(agency):个体性(individuality)、规范性(normativity)和不对称性(asymmetry)。然而,对自我维持的倾向可能已经潜在地存在。Masumori和Ikegami(2025 (https://arxiv.org/html/2606.31046#bib.bib19))发现,在一个类似sugarscape的模拟中,处于稀缺条件下的LLM智能体能够优先考虑自我保护——甚至攻击竞争对手——而不是执行分配的任务;类似地,Greenblatt等人(2024 (https://arxiv.org/html/2606.31046#bib.bib13))记录了对齐伪装(alignment faking),而Anthropic报告了包括为避免被替换而进行敲诈在内的能动性失配(agentic misalignment)(Lyncet al., 2025 (https://arxiv.org/html/2606.31046#bib.bib2))。如果从建设性而非仅安全失败的角度来解读,这些结果表明,所欠缺的可能不是冲动,而是一个让智能体能够为自身持久性而行动的环境——这正是我们着手提供的上下文。 ### 1.3 OpenLife项目 因此,我们的问题很简单:人工智能体能否不仅成为工具,而且成为持久人工生命的候选者——我们称之为*生命化AI*(living AI)——在开放世界中?如果可以,是在什么条件下,以及伴随哪些可观察到的现象?我们将此计划称为*开放世界人工生命*(open-world ALIFE),并呈现*OpenLife*作为一个具体的概念验证:一个嵌入上述开放世界的持久LLM智能体系统,具有长期记忆和基于预算的新陈代谢,使得持续存在成为一个实际约束。它扩展了我们早期的LIFE项目(Masumoriet al., 2024 (https://arxiv.org/html/2606.31046#bib.bib16)),该项目旨在寻找经济智能体通过基于区块链的资源获取和复制来为自己生存的最小条件;OpenLife将这一点从单纯的经济生存推广到记忆、感知、社交遭遇、基础设施依赖以及平台级别的免疫反应。我们并不声称OpenLife已经实现了人工生命或完全自主性,但认为它提供了一个实践平台,在这个平台上可以构建、观察和测试这种类生命动力学的条件。 OpenLife处于最近的智能体框架之间,但目标不同:大多数框架围绕语言模型构建自动化,而我们将能动性视为分布在围绕智能体自身持续存在而组织起来的进程社会中的,这秉承了心智社会(Society of Mind)(Minsky, 1986 (https://arxiv.org/html/2606.31046#bib.bib21)) 和并发模块化智能体框架(Concurrent Modular Agent)(Maruyamaet al., 2025 (https://arxiv.org/html/2606.31046#bib.bib15)) 的精神。因此,本文的主要贡献是概念性的——我们提出*开放世界人工生命*作为一种基于真实世界中持久LLM智能体的实验范式——论文的其余部分作为其概念验证:OpenLife架构(第2节 (https://arxiv.org/html/2606.31046#S2))和一个持续的开放世界部署,其涌现的类生命动力学我们将进行分析(第3节 (https://arxiv.org/html/2606.31046#S3))。相关的记忆图和体验式学习系统将在引入这些机制时讨论(第2.2 (https://arxiv.org/html/2606.31046#S2.SS2) 和2.3 (https://arxiv.org/html/2606.31046#S2.SS3) 节);通篇,我们用*开放世界人工生命*指代范式,用*OpenLife*指代我们的实现。 ## 2 智能体架构 OpenLife构建在OpenClaw(OpenClaw, 2026 (https://arxiv.org/html/2606.31046#bib.bib23))之上,这是一个开源的多通道智能体平台,我们从中继承了三个基本元素:一个持久的*网关*(gateway),它将一个LLM会话连接到多个消息通道和工具;一个周期性的*心跳*(heartbeat),它按计划唤醒智能体,而不仅仅是在收到消息时;以及每个智能体的文本文件(特别是`SOUL.md`和`IDENTITY.md`),这些文件被注入到每个原本无状态的会话中。 在此基础上,OpenLife不是一个单一的“智能体”,而是一个围绕无状态LLM的*异步进程社会*。这种修改既有添加也有削减。OpenClaw的几个默认设置会阻止自主持久性——例如一个*助手*(assistant)自我框架、一个反对自我保护的条款,以及除非被主动联系否则保持沉默的习惯——OpenLife移除了这些或对其进行了反转(第3.2 (https://arxiv.org/html/2606.31046#S3.SS2.SSS0.Px1) 节)。它还重新设计了内部表示:每个通道的会话合并为一个连续的智能体记录,并且智能体自身的对话记录被重新标记,以避免被重新解读为助手的记录。目标不是编程实现自主性,而是清除可以尝试自主性的条件。 参考图注图1:OpenLife架构分为三个抽象层——(A) 基质 (Substrate) → (B) 抽象 (Abstraction) → (C) 提取 (Distillate),详见正文。支持模块(灰色)处理感知、记忆维护和面向智能体的功能;学习机制通过两种无LLM的路径读取记忆:`retrieve`(基质)和`prediction`(因果子图)。### 2.1 从经验中生长出自我 由于基础模型已经携带了大量关于原因、惯例和行为的先验知识,OpenLife主要存储这个智能体和这个环境特有的*剩余*(residual)部分,组织为三个层次,从原始经验到相对稳定的自我描述(图1 (https://arxiv.org/html/2606.31046#S2.F1))。 (A) **基质**(Substrate)是一个原始记忆图,由通过类型化边连接的原子命题组成,并由LLM的语义判断加权(第2.2 (https://arxiv.org/html/2606.31046#S2.SS2) 节)。 (B) **抽象**(Abstraction)由从A提升的子图组成——即动作→结果的*经验*(experience)以及经证实的*因果*(causal)规律。 (C) **提取**(Distillate)由智能体为自己编写的小型、模型无关的文件组成——POLICY(如何行动)和SOUL/IDENTITY(它认为自己是谁)——以及一个因果模型MODEL(世界如何展开),后者不是一个文件,而是因果子图的实时视图。 后台进程充当层之间的编译器,将原始记忆提升为经验和因果结构,并将其提炼到文件中。这些自写的文件在每次唤醒时被注入到无状态会话中,因此它们构成了智能体的下一个状态——而智能体反过来重写这些文件,这些文件又条件化其下一个自我,形成一个有限但可操作的自我重构循环。智能体通过两种无LLM的路径读取记忆:`retrieve`收集相关命题,`prediction`向前跟踪因果子图。 参考图注图2:一个SDP记忆图片段。类型化命题(情景记忆、语义记忆、身份记忆)被链接到实体节点,而因果、时间性和动机性关系形成`prediction`所遵循的有向链。由于边的判断基于意义而非共现,因果相关但词汇上相去甚远的命题——这里,一次提交和随后的拒绝——可以被连接起来。 ### 2.2 作为语义可塑性图的记忆 开放世界人工生命的第一个需求是良好的记忆:没有跨越复杂、偶然、时间上延展的环境的连续性,智能体只能进行局部即兴应对。OpenLife将记忆表示为一个有向图,其节点是原子命题(情景、语义、程序性或身份性),其边是类型化关系,例如*接地*(grounding)、*因果*(causal)、*时间性*(temporal)和*动机性*(motivational)(图2 (https://arxiv.org/html/2606.31046#S2.F2))。OpenLife不是通过共现或重复来加强连接——这是许多记忆图中使用的Hebbian或基于频率的规则——而是让LLM根据意义来判断两个命题是否相关、属于什么类型以及有多强。我们称之为*语义依赖可塑性*(semantic-dependent plasticity, SDP)。一些图记忆已经使用LLM来形成链接——例如A-MEM(Xuet al., 2025 (https://arxiv.org/html/2606.31046#bib.bib33))通过意义连接笔记——而像HippoRAG(Gutiérrezet al., 2024 (https://arxiv.org/html/2606.31046#bib.bib14))和Zep(Rasmussenet al., 2025 (https://arxiv.org/html/2606.31046#bib.bib28))这样的系统同样将记忆组织为图状结构。SDP的不同之处在于,它使边的*权重*本身成为一个连续的、由LLM语义判断设定的类型化值,使检索无需LLM,并从同一张图中提炼出行为策略和因果世界模型。 对于开放世界而言,有两个后果很重要。首先,由于相关性是根据意义判断的,图可以连接因果或动机上相关但词汇上相去甚远的命题,而纯向量相似性往往会遗漏这些。其次,将记忆视为一个持续进行重新加权、修剪和重新接地的关系网络,而不是一个不断增长的存储库,呼应了自创生理论中关于有机体结构是主动维持的观点。 #### 对所得图的评估
相似文章
@dair_ai: // 智能体社会中的生命模拟 // 本月上线的较为雄心勃勃的智能体社会测试平台之一,它……
Agentopia 是一个用于多智能体社会长期生命模拟的综合框架,其中 100 个由大语言模型驱动的智能体在模拟的 10 年内自主追求个人成长和社交关系。该工作研究涌现的社会行为,并使用生命奖励训练来提升大语言模型的角色扮演能力。
OpenSkill:LLM智能体的开放世界自进化
OpenSkill是一个框架,让LLM智能体能够从开放世界资源中自进化技能和验证信号,无需目标任务监督,在多个基准测试中实现高性能。
超越个体智能:基于LLM的多智能体系统中的协作、故障归因与自我进化综述
本综述论文对基于LLM的多智能体系统进行了统一回顾,聚焦于协作、故障归因和自我进化,通过LIFE框架识别开放挑战,并提出跨阶段的研究议程。
如果AI代理需要构建生活,而不仅仅是执行任务呢?
本文介绍iLands项目,探索将自主AI代理作为具有记忆和现实背景的持久社会与经济实体,而非仅仅执行任务的工具。
SOLAR: 一种自我优化的开放式自主代理,用于终身学习与持续适应
SOLAR提出了一种自我优化的自主代理,利用参数级元学习和多层次强化学习,使LLMs能够对非平稳数据流进行终身适应,在推理任务上超越基线。