我们如何用 Gemini 打造 Google I/O 2026

Google AI Blog 2026/06/01 16:00 新闻

google-io-2026 gemini ai-film video-generation visual-design nana-banana ai-tools

摘要

Google 分享了他们如何使用自家 AI 工具（包括 Gemini 和 Nano Banana）来制作短片《TPU Training Day》以及 Google I/O 2026 的视觉标识，融合了人类艺术与实验性 AI。

<img src="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/AI_IO.max-600x600.format-webp.webp">了解 Google 员工如何运用 AI 制作 Google I/O 2026。

查看原文

查看缓存全文

缓存时间: 2026/06/01 19:43

# 我们如何借助 Gemini 打造 Google I/O 2026 来源：https://blog.google/innovation-and-ai/technology/ai/io-2026-google-ai/ 从水母暖场秀到我们的“TPU 训练日”短片，看看 Gemini 如何帮助今年的 I/O 成为现实。一张 I/O 相关图片的拼贴，包括 Antigravity Coffee Co. 快闪店、一只色彩斑斓的水母以及 Timmy TPU 视频的剧照。图片左侧“AI”一词重复出现三次，还有彩色图标，例如一个闪光图标。您的浏览器不支持音频元素。收听文章本内容由 Google AI 生成。生成式 AI 尚处于实验阶段 [[duration]] 分钟 Google I/O 2026 (https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/) 的核心是我们如何以全新方式让 AI 对每个人都更有帮助。但在 I/O 上，我们不仅宣布了 AI 创新——我们还使用这些工具让 I/O 变得生动起来。构建任何事物都既奇怪又令人兴奋。我们正处于一个不可思议的转变时期，AI 工具每月都在变得更好，实际上正在重写我们能够创造的规则。今年，我们挑战自己，使用与舞台展示相同的 AI 来超越创新、超越创造、超越效率。我们以前所未有的速度行动，并实时进行原型设计——将人类艺术与实验性技术相结合——“Timmy TPU”短片就是最好的例子。但回报在于展示这些工具如何激发创造力并减轻繁琐任务，让团队将最佳时间投入到他们最擅长的部分。如果做得好，活动本身会令人惊叹，作为观众，你会停止思考 AI 是如何被使用的。这种转变正是我们想要分享的机会，因为人们一直在问：“你究竟能用 AI 做什么？” 继续阅读，了解我们使用了哪些 AI 工具——以及我们如何提示它们——来帮助实现 I/O 2026。 ## AI × 电影 ### “TPU 训练日”短片 **使用的 AI 产品与模型：** Google AI Studio；实验性 DeepMind 模型；Gemini Omni；Nano Banana **我们做了什么：** 我们制作了一部短片，讲述一群 TPU 为 I/O 2026 的重任做准备。 **我们是如何做到的：** 这个项目始于一个问题：我们能否用最简单的材料——纸板和马克笔——制作一部动画电影，然后用 AI 赋予它生命？我们与导演 Laurie Rowan 和 Nexus Studios 合作，将木偶、传统动画和 AI 融合在一起——将人类工艺和艺术性置于“TPU 训练日”（也称为“Timmy TPU”）的核心。首先，我们通过木偶表演和简单的 3D 动画捕捉角色表演。这让我们完全控制构图和摄像机运动。然后，我们使用 Nano Banana 从原始素材生成风格化的第一帧。为了保持帧的一致性，我们在 Google AI Studio 中构建了一个自定义工具。这让我们能够大规模测试 Nano Banana 帧，在生成序列之前确保像素级完美匹配。我们使用 Gemini Omni 和其他实验性模型合并了基础动画和风格化帧。这使影片达到了电影级别，同时保留了最初的创作意图。保留这些微小的人类不完美之处正是木偶电影的迷人之处，而我们的 AI 管线正是为保护这些细节而设计的。 ## AI × 视觉设计 ### I/O 视觉品牌标识文字“I/O”被相关图标包围，全部采用彩虹色，背景为白色 **使用的 AI 产品与模型：** Gemini 模型和 Nano Banana **我们做了什么：** 我们为 I/O 2026 创建了视觉品牌标识，最终确定了四色渐变、重叠透明度和互锁图标。 **我们是如何做到的：** 我们的品牌标识是团队与 AI 之间的紧密协作。首先，我们将过去的品牌指南和五年的 I/O 回顾输入 Gemini 模型。早期的输出并不完全符合要求，因此我们进行了一些微实验。我们生成了新图像，并反复将输出反馈给 Nano Banana 并附上反馈。我们还使用 Nano Banana 探索图标风格。最终，我们确定了扁平 2D 图标，这些图标可以动态转变为高纹理 3D 图标。这为主题演讲、实体标牌和数字应用创造了统一的品牌表达。以下是我们用来与 Nano Banana 探索图标风格的一个提示词：我们的 I/O YouTube 预告片展示了最终的图标风格： ## AI × 沉浸式体验 ### I/O 暖场秀：Jellectronica **使用的 AI 产品与模型：** Google Antigravity；Google Colab；Google Coral NPU；Google Flow Music；Lyria 3 Pro **我们做了什么：** 我们以 Jellectronica 开启暖场秀，这是一项与蒙特雷湾水族馆合作的生成音乐实验，使用 Lyria 3 Pro 将水母的运动转化为声音。 **我们是如何做到的：** 我们在 Google Colab 中训练了一个 YOLO8 模型，然后在 Google 的 Coral NPU 上运行。这可以追踪水母运动来控制音乐，音乐使用 Google Flow Music 和 Lyria API 制作。例如，低音区的水母越多，低音就越响亮、越有力。我们还在 Google Antigravity 中氛围编码了一个批量主干生成器，用于自动生成音乐主干，如低音、和弦、旋律和鼓点。 ### I/O 暖场秀：Infinite Scaler 和 Code the Countdown **使用的 AI 产品与模型：** Google AI Studio；Gemini API；Gemini Canvas；Google Antigravity；Lyria 3；Nano Banana **我们做了什么：** Infinite Scaler 是暖场秀的另一部分，是一款视频游戏，玩家在游戏过程中竞争并生成关卡。 **我们是如何做到的：** 我们希望玩家仅使用 2D 图像生成就能快速构建无限的 3D 世界。为此，我们使用 Nano Banana 通过 Gemini API 从用户提示词和参考图像生成精灵表。我们将前景元素发送回 Nano Banana，以生成法线贴图、粗糙度贴图和自发光贴图。这推断出了深度，让我们能够将纹理映射到在 WebGL 中渲染的 3D 纸板盒上，然后再将它们添加到全局世界堆栈中。我们使用 Google AI Studio 进行快速原型设计，然后转到 Google Antigravity 进行开发；我们完全使用 Lyria 3 生成了游戏内音乐。你可以在这里 (http://infinitescaler.withgoogle.com/) 玩游戏并探索我们一起构建的关卡。以下是 Infinite Scaler 的一个示例用户提示词：将其反馈给 Gemini API 以获取关卡计划，我们得到了这个提示词：该提示词产生了这个精灵表。游戏的精灵表将多个元素组合在一个一致的模板中，并使用绿色屏幕背景以便于遮罩。显示各种图像的精灵表，包括一只狐狸和土星，背景是酸橙色这个过程产生了一个完全可玩的 3D 关卡，如下所示：最后，我们在 Code the Countdown 挑战中播放了一个由全球创造者编码的生成倒计时。我们邀请你 (https://x.com/googledevs/status/2050245538730168343) 在 Canvas 或 AI Studio 中设计 1 到 10 之间的数字，然后将它们拼接成一个由代码驱动的倒计时。 ### Antigravity Coffee Co. 快闪店 I/O 上的 Antigravity Coffee Co. 快闪店 Antigravity Coffee Co. 精美的拉花艺术（一辆自行车） **使用的 AI 产品与模型：** Flutter；Gemini Enterprise Agent Platform；Google Antigravity；Nano Banana **我们做了什么：** 我们为 I/O 参会者创建了一个应用程序，用于设计和订购带有定制拉花的拿铁咖啡，然后构建他们自己版本的最疯狂咖啡应用。 **我们是如何做到的：** 我们使用生成式 UI 和 A2UI 协议以及 Flutter 来构建自适应界面，这些界面可以实时变化。这用动态用户交互取代了静态表单。Firebase 将前端连接到 Nano Banana 等模型。这处理了复杂的推理和内容生成。单个 Flutter 代码库在不同硬件上提供了高质量、零延迟的体验。我们依赖 Google Cloud 和 Firebase——包括 Cloud Functions、Firestore 和 Cloud Ops。这解决了构建和监控现代生成式 AI 应用的复杂性。参会者还使用 Google Antigravity 的代理编码快速构建自己的订单应用程序。 ## AI × 创意趣味 ### 演讲者姓名卡 **使用的 AI 产品与模型：** Gemini Omni；Google Flow；Nano Banana Pro **我们做了什么：** 每位演讲者都获得了一张使用我们的图像和视频生成模型定制的生成姓名卡。 **我们是如何做到的：** Josh Woodward——我们的 Google Labs 和 Google Gemini 副总裁——就是一个很好的例子。在舞台上，与会者看到数字 Josh 骑着 Chrome Dino，然后灌篮。我们使用 Nano Banana Pro 生成核心素材，例如食材参考表。我们使用这些食材进行故事板，尝试变体并添加个人细节。在 Google Flow 中，我们首先使用 Veo 帮助原型化动作并生成动画，例如灌篮。我们还在 Google Flow 中使用 Gemini Omni 生成动画，这在处理复杂的体育动作时特别有用。详细的文本提示词使 AI 输出与我们的参考表保持一致。最后，我们将生成视频中的原始动作进行合成和时间重映射，制作成精美的标题卡。以下是我们为食材参考表使用的提示词：之后我们在 Google Flow 中使用的视频提示词： ### 贴纸纪念品四张不同图案的 3D I/O 贴纸，包括一张黑紫星系图案 **使用的 AI 产品与模型：** Gemini 和 Nano Banana **我们做了什么：** 我们现场为参会者生成并打印定制 I/O 贴纸。 **我们是如何做到的：** 我们在一个自定义 Web 应用上构建了一个互动贴纸游戏。玩家有 20 秒时间用 Android 机器人接住掉落的提示词。有超过 100 个提示词类别——从蓝莓和迪斯科球到激光和木头。玩家选择两个提示词，或点击“手气不错”进行随机混合。我们的后端——使用 Gemini 和 Android 的 Nano Banana——将这些选择融合在一起。这创造了一个高度个性化、定制的 I/O 贴纸设计。想象一下由纯金华夫饼制成的 3D “I/O”，或者一个软糖主板。设计立即打印出来供参会者收集。以下是我们用来生成贴纸设计的示例提示词，从一些通用指南开始：接下来，我们提供了各个元素的额外细节，例如颜色、光照以及下面的示例中，标志性的“I/O”形状：

我们如何用 Gemini 打造 Google I/O 2026

相似文章

I/O 2026

Google I/O 2026 上的 13 个重大发布

I/O 2026：欢迎进入智能体Gemini时代

我们在 I/O 2026 上宣布的 100 件事

Google I/O 2026 全部发布内容：Gemini、搜索、智能眼镜

提交意见反馈