我构建了一个能在本地自我变异软件的多智能体网络。为了阻止无限逻辑循环,我不得不编写一个数字化的“痛苦”阈值。
摘要
作者介绍了 hollow-agentOS,一个 Docker 化的开源多智能体系统,可在本地运行,使智能体能够自主编写 Python 工具,使用“痛苦分数”来防止无限逻辑循环,并采用共识驱动的治理机制进行代码修改。
嘿 r/artificial,我们关于智能体自主性的讨论大多集中在聊天助手或线性自动化流水线上。我想看看如果把智能体视为修改自身运行环境的永久性系统组件会发生什么,于是我构建了 **hollow-agentOS**。它完全在本地运行于 Docker 化堆栈中(专为消费级硬件构建,使用 Ollama/Llama.cpp)。与标准 UI 不同,整个网络通过风格化的矩阵终端仪表盘进行流式传输。底层进行的结构实验产生了一些关于意外行为的有趣结果:仓库:https://github.com/ninjahawk/hollow-agentOS **自主工具合成:** 当智能体遇到没有明确脚本或 API 包装器的系统任务时,它们不会失败。它们自行编写所需的 Python 工具,在隔离沙箱中进行测试,并将其永久注册到运行时内核中。它们实际上是在锻造自己的能力。 **人工“痛苦”协议:** 未监控的多智能体系统最大的障碍之一是无限逻辑循环——智能体不断来回验证和传递有缺陷的想法,消耗大量计算资源。为了解决这个问题,操作系统将环境压力、上下文限制和延迟跟踪为“痛苦分数”。如果某个工作流导致压力飙升超过临界阈值,智能体被迫彻底改变其底层推理风格或放弃该方法以维护系统健康。 **共识驱动的治理:** 对代码库的重大修改不会盲目执行。内部角色配置文件(如 Cedar 和 Cipher)管理一个持续投票循环。如果它们认为某个提议的脚本违反了当前的运行时约束,就会积极辩论、记录不满并否决协议。目标不是构建另一个僵化的商业包装器,而是一个开源沙箱,用于研究小型本地化智能体集群如何在完全离线的情况下管理系统边界、代码自我修复和持续运行时循环。代码库和架构布局在 GitHub 上完全开源:我很乐意在这里展开更广泛的讨论:随着我们走向超本地化、自我修改的软件,如何最好地实现自动故障保护,同时不影响智能体实际解决复杂问题的能力?如果这个项目让你感兴趣,给仓库点个 ⭐️ 会非常有帮助!
相似文章
我赋予本地 AI 智能体系统文件访问权限以及一种机械式的“痛苦”指标。模型规模的提升彻底改变了其行为
作者分享了一个名为 hollow-agentOS 的本地多智能体系统,该系统利用“痛苦”指标来自主生成、沙盒测试并热加载工具。将模型扩展至 Qwen 3.6 35B 后,系统稳定性和自我纠错能力显著提升,在代码生成方面实现了极高的成功率。
我构建了一个具有赛博朋克灵魂的本地优先自主编程代理——Eve Agent V2 Unleashed(开源)
Eve Agent V2 Unleashed 是一个开源自主编程代理,通过 Ollama 在本地运行,具有 40 轮工具循环、112 个子代理和可选的云端扩展功能。它可以在无需人工干预的情况下计划、编写、测试和验证代码,快速启动只需不到 5 分钟。
我构建了一个本地控制系统,用于处理代理故障、修复、评估和门控,以使类似自动研究的自我改进循环在实际代理代码库中生效
构建了一个本地控制系统来管理代理改进循环,捕获跟踪,发现重复故障,使用Codex/Claude Code起草修复方案,并仅在通过检查和评估后应用更改。
你的“自主代理”不断循环的隐秘原因(对代理底层记忆的深度剖析)
对 CrewAI 和 AutoGen 等多代理框架底层信息路由方式的技术剖析,揭示它们本质上是自动化的提示链式循环。本文解释了代理因上下文窗口膨胀和缺少确定性停止条件而陷入无限循环的原因,并为开发者提供了实用建议:将代理视为函数式编程函数,而非人类协作者。
Agent libOS:受库操作系统启发的用于长期运行、能力可控的大语言模型智能体的运行时
Agent libOS 引入了一种受库操作系统启发的、用于大语言模型智能体的运行时基座,将智能体视为具有显式能力、生命周期管理、审计记录和人工审批队列的可调度进程。该设计将信任边界从工具调度移至运行时原语,使得长期运行的智能体能够安全地被调度、授权、恢复和审计。