Generative Media | I/O 2026 Keynote
摘要
文章介绍了Google I/O 2026 Keynote上发布的生成式媒体产品更新,包括Google Pics图像编辑工具、Stitch UI设计工具,以及Google Flow的新功能如Gemini Omni、多智能体并行处理、自定义工具和音乐混音。强调技术帮助用户将创意快速变为现实。
暂无内容
查看缓存全文
缓存时间:
2026/05/23 07:08
TL;DR: Google I/O 2026 Keynote 介绍了三款生成式媒体产品——Pics(图像创作与编辑)、Stitch(UI 设计)以及 Google Flow(多模态创作)的重大更新,包括 Gemini Omni、智能体、自定义工具和音乐混音功能,强调技术帮助将创意快速变为现实。
## Google Pics:Workspace 中的新图像工具
基于 Nano Banana 的强大能力,Google 推出了 **Google Pics**,一款集成在 Google Workspace 中的图像创作与编辑工具。它支持从派对传单到信息图的几乎任何内容,并提供了精细的创作控制。
- **智能理解**:Pics 能识别作品中的内容和对象之间的相互作用。用户可以悬停在元素上,一键移除或调整大小,以适应画面。
- **文字与翻译**:添加或编辑文字后,只需点击几下即可完成翻译。
- **安全水印**:所有来自 Pics 的输出都带有 SynthID 水印。
- **推出时间**:今年夏天开始推出。
## Stitch:以思维速度构建 UI
Google 内部团队使用的设计产品 **Stitch** 现已面向全球推出新版本。过去一年,全球用户已通过 Stitch 生成了超过 1 亿个 UI 屏幕。如今,它提供了全新的设计方式:
- **实时生成**:只需一个提示,Stitch 即可实时生成 UI 设计。
- **实时协作**:用户可以通过输入提示或语音与 Stitch 协作。例如:“让标题文字更大,更新菜单以突出显示更多披萨选项”,布局会立即更新。
- **导出与发布**:与多种工具相连,可一键将设计导出为代码或直接发布网站。
- **推出时间**:自今天起向全球用户推出。
## Google Flow 的重大更新
Google Flow 自去年 I/O 推出后已有数百万人使用。今年带来三大更新:Gemini Omni、新智能体、自定义工具,以及音乐混音功能。
### Gemini Omni:保留原始表演,改变一切
通过一个简单提示和风格参考,Gemini Omni 能改变环境、添加视觉效果及其他元素,同时完整保留原始表演(如走路姿态、节奏)。用户甚至可以添加新角色,同时保持场景中其他内容不变。
### 新智能体:同时执行多个操作
以前 Flow 每次只能执行一个提示,现在智能体可同时处理多个任务。示例:给定一张图像,智能体分析场景,构思最佳摄影角度,然后将一张图像变成 16 个独特的视频。它还能处理大规模编辑,例如将所有场景从清晨转变为深夜——沙漠天空完全变暗,车灯亮起照亮灰尘。
### Flow 工具:自由编码创意工具
用户可以在 Flow 中随心编码任何创意工具,如视频特效、手绘动画或叠加文字,并根据个人创作流程自定义构建。从今天起即可开始构建、分享和混编工具。
### Flow 音乐:将原始录音变为原创歌曲
用户可以将一段脑海中的钢琴旋律录入 Flow 音乐,提示朝 R&B 方向创作,并配上女性人声。示例中,一段原始录音经过 Flow 处理后生成了指导乐队的小样。这不是最终曲目,但帮助乐队决定后续录制方向。
**所有 Flow 和 Flow 音乐的新功能今天都已可用。**
## 技术是创造力的画布
真正的突破不是技术本身,而是人们用技术创造的一切。从音乐人到小企业,从随心编码者到艺术家,Google 的产品正在帮助缩短从灵光闪现到变为现实之间的距离。
“你正处于一个人类必须最具创造力的时代。”
Source: https://www.youtube.com/watch?v=FLynjUYg79I
相似文章
YouTube AI Channels
Google在I/O 2026上发布Gemini Omni,一个能够从任何输入生成任何输出的新模型,结合世界知识与生成式媒体,实现对话式视频编辑和创意变形,首先推出Gemini Omni Flash。
YouTube AI Channels
Google I/O 2026 大会发布了 Gemini 3.5 Flash/Pro、Gemini Omni 多模态模型、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级,强调全栈 AI 创新与科学应用,展示了一系列新体验和硬件产品。
X AI KOLs
Google 宣布其 AI 创意工作室 Flow 的更新,包括新的 Gemini Omni Flash 模型,用于多模态视频编辑,具有改进的角色一致性;Flow Agent 用于协作规划和批量编辑;以及通过自然语言创建自定义工具。还推出了新的移动应用和音乐生成模型 Lyria 3 Pro。
YouTube AI Channels
Google 在 I/O 2026 上宣布 Gemini 应用的全面重新设计(神经表现)、多模态创作模型 Gemini Omni、以及 Daily brief 和 Gemini Spark 等主动智能体功能,同时推出 macOS 版语音驱动的多文档处理能力。
The Verge
Google 在 I/O 2026 主题演讲中带来多项重大 AI 发布,包括 Gemini 3.5 和 Gemini Omni 模型系列、Gemini 应用重新设计、始终在线的 AI 助手 Spark、Android 应用的 vibe-coding,以及与 Xreal 合作推出的 Project Aura 智能眼镜更新版本。