我们为智能体构建了持久化云服务器。与常规基于聊天的智能体相比,有哪些变化?
摘要
作者介绍了 Computer Agents,这是一个提供持久化云环境的平台,支持文件和终端访问,以增强 AI 智能体在跨会话中的可靠性和上下文保留能力。
声明:我是构建 [Computer Agents](https://computer-agents.com) 团队的一员。该产品是一个智能体计算平台:我们不只是给 AI 智能体提供一个聊天历史记录,而是给它一个持久的云服务器、文件系统、终端/浏览器访问权限、项目任务以及保存的执行历史。**我们要解决的问题:** 很多智能体演示之所以有效,是因为任务很短。实际工作要杂乱得多。智能体需要检查文件、安装依赖、运行命令、处理失败、读取日志、修补问题、保存输出,并在之后继续。如果每次环境都消失,智能体就会重复设置工作并丢失有用的状态。**我们的技术方案:**
* 每次智能体运行都可以在隔离的云环境中进行
* 文件和执行上下文可跨会话持久保存
* 工作可以组织为项目/任务,而不是单一的长聊天
* 任务可以有评审者、产物、日志、评论和状态
* 开发者可以使用 Python/TypeScript SDK 来创建智能体、线程、计算机实例、项目、调度和 Webhook
* 模型路由与工作区执行分离,因此成本较低的模型可以执行高吞吐量的步骤(如初步筛选或代码仓库搜索),而更强的模型则处理更困难的推理/评审任务
**超出预期的效果:** 最大的可靠性提升并不总是来自更聪明的模型。关键在于给予智能体一个稳定的工作空间和具体的任务单。“修复这个模糊的产品领域”表现很差。“复现这个 bug,不要触碰认证模块,运行该命令,总结修改后的文件”表现要好得多。
局限性:
* 我不会信任智能体在无监督情况下合并生产环境变更
* 大规模重构仍需人工审查
* 安全关键变更需要严格的权限控制
* 并行智能体需要文件/任务隔离,否则会导致评审混乱
演示/文档:[https://computer-agents.com](https://computer-agents.com)
我很好奇大家如何处理智能体的持久化问题:你们是将状态保存在聊天历史、向量记忆、工作流图、容器、Git 工作树还是完整的云工作空间中?
相似文章
我一直在尝试自定义智能体,有趣的部分并非任务完成,而是它们拥有记忆后发生的变化
作者反思了实验自定义 AI 智能体的经历,指出长期记忆和连续性将智能体从简单的任务执行者转变为具有“稳定倾向”的持久协作伙伴。这引发了关于智能体“个性”的价值与工作流程中控制、可靠性和可审计性需求之间的矛盾的问题。
介绍 ChatGPT agent
OpenAI 推出 ChatGPT agent,一个统一的智能体系统,结合了网页浏览、深度研究和对话能力,能够自主处理复杂的多步骤任务。该智能体可以浏览网站、分析信息、运行代码和生成交付成果,同时通过权限请求让用户保持控制。
我厌倦了AI开发工具把一切都困在云端,所以我构建了...
AgentBuddy 是一个本地优先、开源的 AI 工作流沙盒,支持持久化代理线程、实时执行追踪和事件驱动工作流,集成了 Claude Code,旨在让 AI 开发保持本地化和透明化。
你的所有智能体都将走向异步
文章指出,AI智能体正从同步聊天界面转向异步后台工作流,并重点介绍了Anthropic、OpenAI和Cursor推出的新功能,这些功能将智能体生命周期与HTTP请求-响应周期解耦。
Workspace 智能体
本文介绍了 OpenAI 在 ChatGPT 中推出的「Workspace Agents」,其设计目标是处理可重复的、结构化的工作流,而非一次性任务。文章阐述了核心概念、组成结构,以及使用和构建这类智能体以实现一致业务流程的最佳实践。