I/O '26 Recap: Everything You Need to Know

YouTube AI Channels 事件

google-io gemini ai-models smart-agents search-update ai-hardware

摘要

Google I/O 2026 大会发布了 Gemini 3.5 Flash/Pro、Gemini Omni 多模态模型、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级，强调全栈 AI 创新与科学应用，展示了一系列新体验和硬件产品。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/05/20 18:53

TL;DR: Google I/O 2026 宣布了 Gemini 3.5 Flash/Pro、Gemini Omni、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级，强调全栈 AI 创新与科学应用。 ## AI 规模与核心指标 Google AI 正以全栈方式推进创新。当前每月处理 3.2 千万亿个 token（此前为 97 万亿，增长 7 倍）。13 个产品各自拥有超过 10 亿用户，其中 5 个产品超过 30 亿用户。Gemini 模型是用户增长的关键驱动力。 - **AI Overviews**：月活用户超过 25 亿，AI Mode 在一年内突破 10 亿月活。 - **Gemini 应用**：月活从去年 I/O 的 4 亿增长至 9 亿，翻了一倍多。 ## 新产品与体验升级 ### Ask YouTube 用户可直接向 YouTube 提问，例如“如何教三岁孩子从平衡车过渡到脚踏车”，体验被彻底重塑。 ### Docs Live 通过语音即可向 Gemini 口述想法，例如：“我刚想起来明天有个校友讲座……你能从 Drive 里把我的简历调出来吗？……直接从那里面提取细节，放在文档顶部。”文档自动生成并填充内容。 ### 训练基础设施采用 JAX 和 Pathways，实现跨站点无缝分布训练，可扩展到全球 TPU 规模，创建世界上最大的训练集群。 ## 模型与速度 ### Flash 模型演示现场创建 Chrome Dino 游戏：提示词后，响应实时生成，token 速度接近每秒 1500 个，远超写请求时间。 ### Gemini App Omni 新模型可从任何输入创建任何内容（视频为起点，未来将支持任何输入/输出），融合 Gemini 智能与生成式媒体模型，达到全新多模态理解与编辑水平。 ### SynthID 与透明度 SynthID 已为超过 1000 亿张图片和视频添加水印，并扩展到搜索和 Chrome。OpenAI、I cacao 和 Lemon Labs 也采用了 SynthID 2。 ## Gemini 3.5 Flash 与 Anti-Gravity ### 3.5 Flash 与 3.1 Pro 相比，所有基准测试均更强，速度更快，处于右上角象限。已在 Anti-Gravity 平台中使用，加速构建过程 12 倍。 ### Anti-Gravity 智能体演示任务：从零构建一个能运行的操作系统，用时 12 小时。93 个子智能体并行工作，发出超过 15,000 次模型请求，处理 26 亿个 token。最初为空的项目最终成为可运行的操作系统核心。现场尝试运行《毁灭战士》失败，通过额外提示让 Anti-Gravity 编写 100 多行代码添加视频和键盘驱动程序，最终成功运行。 ### 3.5 Pro 内部使用中，改进巨大，下个月面向用户交付。 ## Gemini Spark：个人 AI 智能体 Spark 在 Google Cloud 的专用虚拟机上全天候运行，使用 Gemini 3.5 和 Anti-Gravity 框架，可执行长时间后台任务。集成 Google 工具，未来几周通过 MCP 集成第三方工具。 **示例场景**：组织街区派对——Spark 创建实时 RSVP 跟踪器（Google Sheets），记录谁带了什么，并自动给未报名邻居发邮件。另一个任务：创建学年结束前要办的事项文档，自动格式化并链接后续行动。 ## 搜索的下一章 Google 搜索从头到尾都是 AI 搜索。用户可在搜索中创建和管理多个 AI 智能体，设置信息智能体全天候后台工作，与 Gemini Spark 协同。 **示例**：对生物科技公司感兴趣，智能体实时连接金融数据，在关键变化时发送合成更新帮助理解市场。搜索可创建完整的定制化体验：工具、追踪器、仪表盘。例如，主动构建周末规划器，安全连接 Gmail、照片和日历，显示餐厅预订及地图。 ## 智能体电商每天用户通过 Google 购物超过十亿次。三个关键构建块： 1. 通用商务协议（UCP） 2. 智能体支付协议（AP2） 3. 通用购物车：真正智能的购物车，在后台工作。例如，组装 PC 时，购物车发现处理器插槽与主板不兼容，自动建议替代方案，防止问题。 ## Gemini 体验全新设计使用 Neural Expressive 完全重新设计。新增每日简报——个性化摘要，综合收件箱、日历、任务，每天早晨首站获取最重要信息。 ## Google Picks：Workspace 创意工具图像创建与编辑工具，可悬停删除元素、调整对象大小、添加/编辑文本、一键翻译。 ## Google Flow 多行动以前一次只能执行一个提示，现在智能体可同时采取多个行动（分析图像、构思角度，一张图片生成 16 个独特视频）。 ## 音频眼镜第一代音频眼镜将于今年秋季上市。与三星、Gentle Monster、Warby Parker 等合作。通过 Gemini 提供全天候帮助，语音私密传入耳朵。示例：在咖啡店说“下单”，Gemini 自动打开 DoorDash 选择咖啡并确认。 ## Gemini for Science 汇集强大 AI 工具加速研究。新的 Labs 原型可简化日常科学任务：跟踪新论文、将研究目标转化为代码、生成新假设。 > 技术是创造力的画布，AI 将成为科学发现新黄金时代的催化剂。 Source: https://www.youtube.com/watch?v=tfx2CjqtCUI

I/O '26 Recap: Everything You Need to Know

相似文章

@Khazix0918: https://x.com/Khazix0918/status/2056894400320708671

我们在 I/O 2026 上宣布的 100 件事

I/O 2026

Google I/O 2026 上的 13 个重大发布

Gemini | I/O 2026 Keynote

提交意见反馈