Project Genie:探索无限交互世界的实验性项目

Google DeepMind Blog 产品

摘要

Google 推出了 Project Genie,这是一个面向 Google AI Ultra 订阅用户的实验性原型,允许用户使用 Genie 3 创建、探索和重新混合无限交互世界。

美国地区的 Google AI Ultra 订阅用户现在可以尝试 Project Genie,这是一个实验性研究原型,让你能够创建并探索各种世界。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/08 09:21

# Project Genie:探索无限交互式世界实验 来源:https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/ 美国 Google AI Ultra 订阅用户现可体验 Project Genie,这是一个实验性研究原型,让你能够创建并探索各种世界。 Elliott Breece Google Labs 产品经理 Suz Chambers Google Creative Lab 总监 ## 总体概述 Google 正在向美国 Google AI Ultra 订阅用户推出 Project Genie。这是一个研究原型,让你能够创建、探索和重新混合交互式世界。你可以使用文本提示和图像来构建环境,并实时在其中导航。 摘要由 Google AI 生成。生成式 AI 处于实验阶段。 ## 要点 - "Project Genie" 让 Google AI Ultra 用户能够创建、探索和重新混合交互式世界 - Genie 3 为该原型提供支持,在你移动和交互时实时生成路径 - 用户可以通过文本/图像勾勒世界,进行探索,并重新混合现有创作 - 该原型存在局限性,如世界真实感和角色控制方面,但正在不断改进 - Google 目标是适时扩大 Project Genie 及其世界构建技术的访问范围 摘要由 Google AI 生成。生成式 AI 处于实验阶段。 #### 探索其他风格: 您的浏览器不支持音频元素。 收听文章 此内容由 Google AI 生成。生成式 AI 处于实验阶段 [[duration]] 分钟 今年八月,我们预览了 Genie 3 (https://deepmind.google/blog/genie-3-a-new-frontier-for-world-models/),这是一个能够生成多样化交互式环境的通用世界模型。即使在这个早期阶段,受信任的测试者已经能够创造出令人印象深刻的迷人世界和体验,并发现了全新的使用方式。下一步是通过一个专注于沉浸式世界创建的专用交互原型来扩大访问范围。 从今天开始,我们向美国的 Google AI Ultra 订阅用户(18 岁以上)推出 Project Genie (http://labs.google/projectgenie/) 的访问权限。这个实验性研究原型让用户能够创建、探索和重新混合他们自己的交互式世界。 ## 我们如何推进世界模型 世界模型模拟环境的动态变化,预测它们如何演变以及行动如何影响它们。虽然 Google DeepMind 在特定环境的智能体方面有着悠久历史,如国际象棋 (https://deepmind.google/research/alphazero-and-muzero/) 或围棋 (https://deepmind.google/research/alphago/?_gl=1*1rofsan*_up*MQ..*_ga*MTU2MTkwNzU1Ni4xNzY5Mzc1ODQz*_ga_LS8HVHCNQ0*czE3NjkzNzU4NDMkbzEkZzAkdDE3NjkzNzU4NDMkajYwJGwwJGgw),但构建 AGI 需要能够应对现实世界多样性的系统。 为了应对这一挑战并支持我们的 AGI 使命,我们开发了 Genie 3。与静态 3D 快照中的可探索体验不同,Genie 3 在你移动和与世界交互时实时生成前方的路径。它为动态世界模拟物理和交互,而其突破性的连贯性使其能够模拟任何真实世界场景——从机器人技术和动画建模到小说创作,再到探索地点和历史场景。 基于我们与来自各行业和领域的受信任测试者的模型研究工作,我们正通过实验性研究原型 Project Genie 迈出下一步。 ## Project Genie 如何工作 Project Genie 是一个由 Genie 3、Nano Banana Pro (https://deepmind.google/models/gemini-image/pro/) 和 Gemini (http://gemini.google.com/) 提供支持的原型网页应用,让用户能够 firsthand 体验我们世界模型的沉浸式体验。该体验围绕三大核心能力展开: ### 1. 世界勾勒 使用文本提示以及生成或上传的图像来创建一个不断扩展的鲜活环境。创建你的角色、你的世界,并定义你想要如何探索它——从步行到骑行,从飞行到驾驶,以及任何超越这些的方式。 为了更精确的控制,我们将"世界勾勒"与 Nano Banana Pro 集成。这让你能够预览世界的外观,并在进入之前修改图像来微调你的世界。你还可以为角色定义视角——如第一人称或第三人称——让你在进入场景之前控制体验方式。 ### 2. 世界探索 你的世界是一个等待探索的可导航环境。当你移动时,Project Genie 会根据你采取的行动实时生成前方的路径。你还可以在穿越世界时调整摄像机角度。 ### 3. 世界重新混合 通过在现有提示的基础上构建,将现有世界重新混合成全新的诠释。你还可以在画廊中探索精选世界,或选择随机图标获取灵感,并在此基础上构建。完成后,你可以下载你的世界和探索过程的视频。 ## 我们如何负责任地构建 Project Genie 是 Google Labs 中的一个实验性研究原型,由 Genie 3 提供支持。与我们所有通往通用 AI 系统的工作一样,我们的使命是负责任地构建 AI 以造福人类。由于 Genie 3 是一个早期研究模型,存在一些已知的改进领域: - 生成的世界可能看起来不完全真实,或并不总是严格遵循提示、图像或真实世界物理 - 角色有时可能较难控制,或控制延迟较高 - 生成限制在 60 秒以内 我们八月宣布的 Genie 3 模型的一些能力,如可提示的事件(在你探索时改变世界),尚未包含在此原型中。你可以在 此处 (http://deepmind.google/genie) 找到有关模型局限性和未来改进体验的更多细节。 基于我们与受信任测试者一直在进行的工作,我们很高兴与使用我们最先进 AI 的用户分享这个原型,以更好地了解人们将在 AI 研究和生成式媒体的诸多领域如何使用世界模型。 Project Genie 的访问权限从今天开始向美国 Google AI Ultra 订阅用户 (https://one.google.com/about/google-ai-plans/)1 (https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/#footnote-1)(18 岁以上)推出,并将适时扩展到更多地区。我们期待看到他们创造的无限多样的世界,并且我们的目标是适时让更多用户能够使用这些体验和技术。 ### 相关故事

相似文章

Genie 3:世界模型的新前沿

Google DeepMind Blog

DeepMind 发布 Genie 3,一个通用世界模型,能够从文本提示生成交互式环境,分辨率达 720p、帧率 24fps,相比前代版本具有更好的一致性和实时交互能力。

Project Genie | Shine and Seek

YouTube AI Channels

Google DeepMind 的 Project Genie 是一个统一的世界模型,它将多样化的电子游戏视为条件视频预测任务,从而生成并与这些游戏进行交互。

Project Genie | 跳伞

YouTube AI Channels

这是 Google DeepMind 发布的一段视觉演示,展示了 Project Genie 在跳伞场景下的应用,视频中没有口播内容。

Project Genie | Silver Sphere

YouTube AI Channels

一段来自 Google DeepMind 的视频,标题为“Project Genie | Silver Sphere”,没有音轨,因此无法提取技术细节。标题暗示这可能是一个人工智能模型或项目的发布。