I/O '26 Recap: Everything You Need to Know
摘要
Google I/O 2026 大会发布了 Gemini 3.5 Flash/Pro、Gemini Omni 多模态模型、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级,强调全栈 AI 创新与科学应用,展示了一系列新体验和硬件产品。
暂无内容
查看缓存全文
缓存时间:
2026/05/20 18:53
TL;DR: Google I/O 2026 宣布了 Gemini 3.5 Flash/Pro、Gemini Omni、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级,强调全栈 AI 创新与科学应用。
## AI 规模与核心指标
Google AI 正以全栈方式推进创新。当前每月处理 3.2 千万亿个 token(此前为 97 万亿,增长 7 倍)。13 个产品各自拥有超过 10 亿用户,其中 5 个产品超过 30 亿用户。Gemini 模型是用户增长的关键驱动力。
- **AI Overviews**:月活用户超过 25 亿,AI Mode 在一年内突破 10 亿月活。
- **Gemini 应用**:月活从去年 I/O 的 4 亿增长至 9 亿,翻了一倍多。
## 新产品与体验升级
### Ask YouTube
用户可直接向 YouTube 提问,例如“如何教三岁孩子从平衡车过渡到脚踏车”,体验被彻底重塑。
### Docs Live
通过语音即可向 Gemini 口述想法,例如:“我刚想起来明天有个校友讲座……你能从 Drive 里把我的简历调出来吗?……直接从那里面提取细节,放在文档顶部。”文档自动生成并填充内容。
### 训练基础设施
采用 JAX 和 Pathways,实现跨站点无缝分布训练,可扩展到全球 TPU 规模,创建世界上最大的训练集群。
## 模型与速度
### Flash 模型演示
现场创建 Chrome Dino 游戏:提示词后,响应实时生成,token 速度接近每秒 1500 个,远超写请求时间。
### Gemini App Omni
新模型可从任何输入创建任何内容(视频为起点,未来将支持任何输入/输出),融合 Gemini 智能与生成式媒体模型,达到全新多模态理解与编辑水平。
### SynthID 与透明度
SynthID 已为超过 1000 亿张图片和视频添加水印,并扩展到搜索和 Chrome。OpenAI、I cacao 和 Lemon Labs 也采用了 SynthID 2。
## Gemini 3.5 Flash 与 Anti-Gravity
### 3.5 Flash
与 3.1 Pro 相比,所有基准测试均更强,速度更快,处于右上角象限。已在 Anti-Gravity 平台中使用,加速构建过程 12 倍。
### Anti-Gravity 智能体演示
任务:从零构建一个能运行的操作系统,用时 12 小时。93 个子智能体并行工作,发出超过 15,000 次模型请求,处理 26 亿个 token。最初为空的项目最终成为可运行的操作系统核心。现场尝试运行《毁灭战士》失败,通过额外提示让 Anti-Gravity 编写 100 多行代码添加视频和键盘驱动程序,最终成功运行。
### 3.5 Pro
内部使用中,改进巨大,下个月面向用户交付。
## Gemini Spark:个人 AI 智能体
Spark 在 Google Cloud 的专用虚拟机上全天候运行,使用 Gemini 3.5 和 Anti-Gravity 框架,可执行长时间后台任务。集成 Google 工具,未来几周通过 MCP 集成第三方工具。
**示例场景**:组织街区派对——Spark 创建实时 RSVP 跟踪器(Google Sheets),记录谁带了什么,并自动给未报名邻居发邮件。另一个任务:创建学年结束前要办的事项文档,自动格式化并链接后续行动。
## 搜索的下一章
Google 搜索从头到尾都是 AI 搜索。用户可在搜索中创建和管理多个 AI 智能体,设置信息智能体全天候后台工作,与 Gemini Spark 协同。
**示例**:对生物科技公司感兴趣,智能体实时连接金融数据,在关键变化时发送合成更新帮助理解市场。
搜索可创建完整的定制化体验:工具、追踪器、仪表盘。例如,主动构建周末规划器,安全连接 Gmail、照片和日历,显示餐厅预订及地图。
## 智能体电商
每天用户通过 Google 购物超过十亿次。三个关键构建块:
1. 通用商务协议(UCP)
2. 智能体支付协议(AP2)
3. 通用购物车:真正智能的购物车,在后台工作。例如,组装 PC 时,购物车发现处理器插槽与主板不兼容,自动建议替代方案,防止问题。
## Gemini 体验全新设计
使用 Neural Expressive 完全重新设计。新增每日简报——个性化摘要,综合收件箱、日历、任务,每天早晨首站获取最重要信息。
## Google Picks:Workspace 创意工具
图像创建与编辑工具,可悬停删除元素、调整对象大小、添加/编辑文本、一键翻译。
## Google Flow 多行动
以前一次只能执行一个提示,现在智能体可同时采取多个行动(分析图像、构思角度,一张图片生成 16 个独特视频)。
## 音频眼镜
第一代音频眼镜将于今年秋季上市。与三星、Gentle Monster、Warby Parker 等合作。通过 Gemini 提供全天候帮助,语音私密传入耳朵。示例:在咖啡店说“下单”,Gemini 自动打开 DoorDash 选择咖啡并确认。
## Gemini for Science
汇集强大 AI 工具加速研究。新的 Labs 原型可简化日常科学任务:跟踪新论文、将研究目标转化为代码、生成新假设。
> 技术是创造力的画布,AI 将成为科学发现新黄金时代的催化剂。
Source: https://www.youtube.com/watch?v=tfx2CjqtCUI
相似文章
X AI KOLs Timeline
总结2026年Google I/O开发者大会的核心发布,包括Gemini 3.5 Flash模型、Gemini Omni Flash、Antigravity 2.0、Gemini Spark等AI模型、产品与Agent系统。
Google AI Blog
Google I/O 2026 上发布了一系列公告,包括推出先进 AI 模型 Gemini 3.5 Flash 和 Gemini Omni,以及新的开发者工具和平台更新。
Google AI Blog
在 Google I/O 2026 上,Google 发布了新 AI 模型 Gemini Omni 和 Gemini 3.5 Flash,以及基于代理的开发平台 Antigravity,并推出了多项产品更新,包括 Universal Cart 和跨产品的代理功能。
The Verge
Google 在 I/O 2026 主题演讲中带来多项重大 AI 发布,包括 Gemini 3.5 和 Gemini Omni 模型系列、Gemini 应用重新设计、始终在线的 AI 助手 Spark、Android 应用的 vibe-coding,以及与 Xreal 合作推出的 Project Aura 智能眼镜更新版本。
YouTube AI Channels
Google 在 I/O 2026 上宣布 Gemini 应用的全面重新设计(神经表现)、多模态创作模型 Gemini Omni、以及 Daily brief 和 Gemini Spark 等主动智能体功能,同时推出 macOS 版语音驱动的多文档处理能力。