我们为智能体构建了持久化云服务器。与常规基于聊天的智能体相比,有哪些变化?

Reddit r/ArtificialInteligence 产品

摘要

作者介绍了 Computer Agents,这是一个提供持久化云环境的平台,支持文件和终端访问,以增强 AI 智能体在跨会话中的可靠性和上下文保留能力。

声明:我是构建 [Computer Agents](https://computer-agents.com) 团队的一员。该产品是一个智能体计算平台:我们不只是给 AI 智能体提供一个聊天历史记录,而是给它一个持久的云服务器、文件系统、终端/浏览器访问权限、项目任务以及保存的执行历史。**我们要解决的问题:** 很多智能体演示之所以有效,是因为任务很短。实际工作要杂乱得多。智能体需要检查文件、安装依赖、运行命令、处理失败、读取日志、修补问题、保存输出,并在之后继续。如果每次环境都消失,智能体就会重复设置工作并丢失有用的状态。**我们的技术方案:** * 每次智能体运行都可以在隔离的云环境中进行 * 文件和执行上下文可跨会话持久保存 * 工作可以组织为项目/任务,而不是单一的长聊天 * 任务可以有评审者、产物、日志、评论和状态 * 开发者可以使用 Python/TypeScript SDK 来创建智能体、线程、计算机实例、项目、调度和 Webhook * 模型路由与工作区执行分离,因此成本较低的模型可以执行高吞吐量的步骤(如初步筛选或代码仓库搜索),而更强的模型则处理更困难的推理/评审任务 **超出预期的效果:** 最大的可靠性提升并不总是来自更聪明的模型。关键在于给予智能体一个稳定的工作空间和具体的任务单。“修复这个模糊的产品领域”表现很差。“复现这个 bug,不要触碰认证模块,运行该命令,总结修改后的文件”表现要好得多。 局限性: * 我不会信任智能体在无监督情况下合并生产环境变更 * 大规模重构仍需人工审查 * 安全关键变更需要严格的权限控制 * 并行智能体需要文件/任务隔离,否则会导致评审混乱 演示/文档:[https://computer-agents.com](https://computer-agents.com) 我很好奇大家如何处理智能体的持久化问题:你们是将状态保存在聊天历史、向量记忆、工作流图、容器、Git 工作树还是完整的云工作空间中?
查看原文

相似文章

介绍 ChatGPT agent

OpenAI Blog

OpenAI 推出 ChatGPT agent,一个统一的智能体系统,结合了网页浏览、深度研究和对话能力,能够自主处理复杂的多步骤任务。该智能体可以浏览网站、分析信息、运行代码和生成交付成果,同时通过权限请求让用户保持控制。

你的所有智能体都将走向异步

Hacker News Top

文章指出,AI智能体正从同步聊天界面转向异步后台工作流,并重点介绍了Anthropic、OpenAI和Cursor推出的新功能,这些功能将智能体生命周期与HTTP请求-响应周期解耦。

Workspace 智能体

OpenAI Blog

本文介绍了 OpenAI 在 ChatGPT 中推出的「Workspace Agents」,其设计目标是处理可重复的、结构化的工作流,而非一次性任务。文章阐述了核心概念、组成结构,以及使用和构建这类智能体以实现一致业务流程的最佳实践。