用 GPT-4o 创建智能体与人类协作

OpenAI Blog 产品

摘要

由麻省理工学院前教授罗伯特·杨博士创办的 Altera,推出了由 GPT-4o 驱动的自主 AI 智能体,可以与人类协作玩《我的世界》。该公司通过将 OpenAI 的语言模型与受脑启发的并行架构相结合,解决了长时间 AI 自主运行中的数据退化问题。

Altera 利用 GPT-4o 开拓人类协作的新领域
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 14:51

# OpenAI 和 Altera 标志出现在白色背景上,中央是一片橙色叶子的特写图像,显示复杂的叶脉细节。 来源:https://openai.com/index/altera/ OpenAI 的罗伯特·杨博士花了半生时间开发受大脑启发的 AI。 2023 年,当 OpenAI 的语言模型变得广泛可用时,杨从麻省理工学院助理教授的职位上辞职创办了 Altera.AL(https://altera.al/),这是一家专注于构建他们所称的"数字人类"的研究实验室:一种让人们与具有基本人类特性的智能体互动的新方式。 现任 Altera CEO 的杨设想了一个未来,在这个未来中,AI 智能体不仅提供协助;他认为很快,它们将与人类互动和协作,甚至体验情感。杨与他的三位联合创始人安德鲁·安博士、尼科·克里斯蒂和罗树英一起,用 GPT-4o 构建了 Altera 的第一款产品:第一批能够在 Minecraft(https://playlabs.altera.al/discover) 中像朋友一样和你一起玩的自主智能体。 该图像邀请用户"来和 Altera 朋友一起玩",展示了方块风格的角色,并提供了 Discord 和 Google 登录选项。背景展示了模糊的游戏标题。 正如自动化通过支持重复性任务来增强人类能力一样,Altera 团队认为数字人类能够进行富有成效的协作,甚至与人们建立联系。这可能看起来像: - 数字"同事"可以协作数天或数周,主动解决问题 - 长期多智能体世界,我们可以测量对经济政策、广告等的反应 但 Altera 在着手构建时遇到了独特的挑战。最紧迫的问题是数据退化现象,这是困扰所有在扩展时间框架内做出自主决策的 AI 模型的问题。 "AI 智能体与世界互动,实时做出决策,但当它们自己的输出成为未来的输入时,数据质量会随着时间推移而降低,"杨解释道。"这是大多数 AI 智能体系统都会遇到的问题,但对于我们的数字人类,他们意味着要自主运行数小时甚至更长时间,这成为了最紧迫的问题之一。" Altera > 媒体 > 产品 2 为了对抗数据退化并增加其 AI 智能体的长期自主性,Altera 求助于 OpenAI 的语言模型,这在维护决策过程的完整性方面被证明是关键的。 OpenAI 的先进模型使 Altera 能够构建第一批 AI 智能体,可以像朋友一样和人们玩游戏。这些智能体能实现更长、更复杂的交互,而不会出现之前限制智能体潜力的性能快速下降。 通过将 OpenAI 的 GPT 模型与 Altera 的模拟人脑结构(包括前额叶皮层)的并行多模块系统相结合,该公司能够创建能够模拟认知功能的智能体。"我们的复合系统并行组合各种模块,每个模块都由 OpenAI 模型驱动。这些模块受大脑功能启发,例如注意力瓶颈、工作记忆和社交认知,"杨说。 > "这使我们的智能体能够思考更快,处理情感,并最终建立长期的自我意识。" Altera CEO 罗伯特·杨博士 Altera 观察到,当由 OpenAI 驱动时,他们的数字人类表现出更大的稳定性,并能更有效地处理复杂任务。即使使用成本较低的模型,OpenAI 的性能也优于市场上的其他产品。 截至 2024 年年中,Altera 的数字人类可以连续自主运行长达四小时——与市场上其他 AI 模型相比,这是一个显著的提升。 ##### 长期基准:Minecraft 中的不同物品收集 使用 GPT-4o 收集的总不同物品的 32% 6.4% 1.9% 0.5% Altera 愿景的早期成功引起了广泛关注,特别是针对他们的第一款产品——一个能够在 Minecraft 等虚拟环境中玩耍和互动的数字人类。它也为未来更复杂的多智能体模拟奠定了基础。 Altera 计划扩大力度,创建能够进行细致入微、长期交互的整个数字人类社会,应用范围从游戏到生产力等多个领域。他们与 OpenAI 的协作使 Altera 能够引领创造一个数字生活和人类生活以发人深省的方式相交的世界。 Altera > 媒体 > 产品 3 ## 继续阅读

相似文章

介绍 ChatGPT agent

OpenAI Blog

OpenAI 推出 ChatGPT agent,一个统一的智能体系统,结合了网页浏览、深度研究和对话能力,能够自主处理复杂的多步骤任务。该智能体可以浏览网站、分析信息、运行代码和生成交付成果,同时通过权限请求让用户保持控制。

计算机使用代理

OpenAI Blog

# 计算机使用代理 来源: [https://openai.com/index/computer-using-agent/](https://openai.com/index/computer-using-agent/) 通过计算机使用代理(Computer-Using Agent)为Operator提供支持,这是AI与数字世界交互的通用接口。今天我们推出了[Operator⁠\(在新窗口中打开\)](https://operator.chatgpt.com/)的研究预览版,这是一个能够在网络上为你执行任务的代理。Operator由计算机使用代理(CUA)驱动,这是一个结合了GPT-4o视觉功能的模型

ChatGPT agent 系统卡

OpenAI Blog

OpenAI 发布 ChatGPT agent,一个结合了深度研究和操作员功能的代理模型,具备终端访问和外部数据连接器,并在生物和化学领域配备了全面的安全防护措施和预防性控制。

创建下一代角色

OpenAI Blog

文章讨论使用 GPT-3 来为应用程序创建高级人工智能驱动的角色,可能用于游戏、交互式媒体或虚拟环境。

企业利用OpenAI在Cloudflare Agent Cloud中驱动智能代理工作流

OpenAI Blog

Cloudflare与OpenAI合作,使OpenAI的前沿模型(包括GPT-5.4)可直接在Cloudflare Agent Cloud中访问,从而使企业能够大规模部署AI代理以执行实际任务。该集成还包括Codex工具,这些工具现已在Cloudflare Sandboxes中全面可用,并即将在Workers AI中提供。