Agent libOS:受库操作系统启发的用于长期运行、能力可控的大语言模型智能体的运行时
摘要
Agent libOS 引入了一种受库操作系统启发的、用于大语言模型智能体的运行时基座,将智能体视为具有显式能力、生命周期管理、审计记录和人工审批队列的可调度进程。该设计将信任边界从工具调度移至运行时原语,使得长期运行的智能体能够安全地被调度、授权、恢复和审计。
大语言模型(LLM)智能体正在从请求-响应助手演进为长期运行的软件主体:它们跨模型调用维护状态、分叉子任务、等待外部事件、请求人工授权、生成工具,并执行必须被恢复和审计的副作用。本文提出 Agent libOS,一种受库操作系统启发的用于 LLM 智能体的运行时基座。Agent libOS 在传统宿主操作系统之上运行;它不实现硬件驱动、内核模式隔离或与 POSIX 兼容的操作系统。相反,它将智能体视为 AgentProcess:一个具有进程身份、父子关系、生命周期状态、源自 AgentImage 的工具表、类型化对象内存、显式能力、人工队列、检查点、事件和审计记录的可调度执行主体。其核心设计原则是:工具是类似 libc 的封装器;运行时原语是权限边界。文件系统访问、对象访问、休眠、人工审批、JIT 工具注册以及外部副作用均根据显式能力和策略在原语边界处进行检查。
我们描述了该设计、威胁模型、Python 原型以及面向安全的评估。目前的原型实现了异步调度、命名空间本地对象内存、运行时集成的人工审批、一次性权限授予、每进程工作目录、Shell 和镜像注册原语、基于 libOS 系统调用代理的 Deno/TypeScript JIT 工具、文件系统/对象桥接工具、可注入的资源提供者基座、确定性演示、真实模型烟雾测试脚本以及截至撰写时的 123 个回归测试。Agent libOS 并非为了提高规划器准确性,而是展示了一种运行时基座,在该基座中,长期运行的 LLM 智能体可以被调度、授权、恢复和审计,而无需将工具调度视为信任边界。
相似文章
我们开源了一个代理运行时,专为人们常忽略的部分构建:在真实硬件上离线运行代理
一个开源的代理运行时,专为在真实硬件上离线运行AI代理而设计,支持硬件I/O(GPIO/MQTT/OPC-UA)作为一级节点和可视化构建器,支持多提供商LLM和本地RAG。
@ishaan_jaff: 我们正在开源 LiteLLM Agent 平台,可以在隔离的 K8s 沙箱中运行 Claude Code、Codex、Hermes 或任何编码代理…
LiteLLM 正在开源其 Agent 平台,允许开发者在隔离的 Kubernetes 沙箱中运行 Claude Code、Codex 和 Hermes 等编码代理,而不会暴露真实的 API 密钥。
@MaxJunestrand:今天我们宣布推出Legora aOS™。这是我们三年来一直在努力构建的成果,我认为这是……
Legora宣布推出Legora aOS,这是一种代理型操作系统,旨在利用新的Legora Agent自主编排从案件受理到交付的整个法律工作流程。
Formal Skill: 面向高效精准LLM智能体的可编程运行时技能
本文介绍了Formal Skill,这是一种面向LLM智能体的运行时原生抽象,它将可重用流程编码为可执行状态机,配有JSON元数据、Python执行器和钩子控制的逻辑。还介绍了一个名为FairyClaw的开源实现,在Harness-Bench上展示了具有竞争力的性能,且减少了token使用量。
编码智能体是否需要类操作系统的控制平面?我构建了一个原型并寻求批评意见。
作者介绍了“KnowledgeOS”,这是一个原型控制平面,旨在通过管理任务生命周期、防止状态漂移和确保执行证据来治理本地编码智能体。他们希望获得关于此类操作系统级抽象是否必要,或者是否属于智能体工作流中过度设计的架构批评。