I/O '26 Recap: Everything You Need to Know

YouTube AI Channels 事件

摘要

Google I/O 2026 大会发布了 Gemini 3.5 Flash/Pro、Gemini Omni 多模态模型、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级,强调全栈 AI 创新与科学应用,展示了一系列新体验和硬件产品。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/20 18:53

TL;DR: Google I/O 2026 宣布了 Gemini 3.5 Flash/Pro、Gemini Omni、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级,强调全栈 AI 创新与科学应用。 ## AI 规模与核心指标 Google AI 正以全栈方式推进创新。当前每月处理 3.2 千万亿个 token(此前为 97 万亿,增长 7 倍)。13 个产品各自拥有超过 10 亿用户,其中 5 个产品超过 30 亿用户。Gemini 模型是用户增长的关键驱动力。 - **AI Overviews**:月活用户超过 25 亿,AI Mode 在一年内突破 10 亿月活。 - **Gemini 应用**:月活从去年 I/O 的 4 亿增长至 9 亿,翻了一倍多。 ## 新产品与体验升级 ### Ask YouTube 用户可直接向 YouTube 提问,例如“如何教三岁孩子从平衡车过渡到脚踏车”,体验被彻底重塑。 ### Docs Live 通过语音即可向 Gemini 口述想法,例如:“我刚想起来明天有个校友讲座……你能从 Drive 里把我的简历调出来吗?……直接从那里面提取细节,放在文档顶部。”文档自动生成并填充内容。 ### 训练基础设施 采用 JAX 和 Pathways,实现跨站点无缝分布训练,可扩展到全球 TPU 规模,创建世界上最大的训练集群。 ## 模型与速度 ### Flash 模型演示 现场创建 Chrome Dino 游戏:提示词后,响应实时生成,token 速度接近每秒 1500 个,远超写请求时间。 ### Gemini App Omni 新模型可从任何输入创建任何内容(视频为起点,未来将支持任何输入/输出),融合 Gemini 智能与生成式媒体模型,达到全新多模态理解与编辑水平。 ### SynthID 与透明度 SynthID 已为超过 1000 亿张图片和视频添加水印,并扩展到搜索和 Chrome。OpenAI、I cacao 和 Lemon Labs 也采用了 SynthID 2。 ## Gemini 3.5 Flash 与 Anti-Gravity ### 3.5 Flash 与 3.1 Pro 相比,所有基准测试均更强,速度更快,处于右上角象限。已在 Anti-Gravity 平台中使用,加速构建过程 12 倍。 ### Anti-Gravity 智能体演示 任务:从零构建一个能运行的操作系统,用时 12 小时。93 个子智能体并行工作,发出超过 15,000 次模型请求,处理 26 亿个 token。最初为空的项目最终成为可运行的操作系统核心。现场尝试运行《毁灭战士》失败,通过额外提示让 Anti-Gravity 编写 100 多行代码添加视频和键盘驱动程序,最终成功运行。 ### 3.5 Pro 内部使用中,改进巨大,下个月面向用户交付。 ## Gemini Spark:个人 AI 智能体 Spark 在 Google Cloud 的专用虚拟机上全天候运行,使用 Gemini 3.5 和 Anti-Gravity 框架,可执行长时间后台任务。集成 Google 工具,未来几周通过 MCP 集成第三方工具。 **示例场景**:组织街区派对——Spark 创建实时 RSVP 跟踪器(Google Sheets),记录谁带了什么,并自动给未报名邻居发邮件。另一个任务:创建学年结束前要办的事项文档,自动格式化并链接后续行动。 ## 搜索的下一章 Google 搜索从头到尾都是 AI 搜索。用户可在搜索中创建和管理多个 AI 智能体,设置信息智能体全天候后台工作,与 Gemini Spark 协同。 **示例**:对生物科技公司感兴趣,智能体实时连接金融数据,在关键变化时发送合成更新帮助理解市场。 搜索可创建完整的定制化体验:工具、追踪器、仪表盘。例如,主动构建周末规划器,安全连接 Gmail、照片和日历,显示餐厅预订及地图。 ## 智能体电商 每天用户通过 Google 购物超过十亿次。三个关键构建块: 1. 通用商务协议(UCP) 2. 智能体支付协议(AP2) 3. 通用购物车:真正智能的购物车,在后台工作。例如,组装 PC 时,购物车发现处理器插槽与主板不兼容,自动建议替代方案,防止问题。 ## Gemini 体验全新设计 使用 Neural Expressive 完全重新设计。新增每日简报——个性化摘要,综合收件箱、日历、任务,每天早晨首站获取最重要信息。 ## Google Picks:Workspace 创意工具 图像创建与编辑工具,可悬停删除元素、调整对象大小、添加/编辑文本、一键翻译。 ## Google Flow 多行动 以前一次只能执行一个提示,现在智能体可同时采取多个行动(分析图像、构思角度,一张图片生成 16 个独特视频)。 ## 音频眼镜 第一代音频眼镜将于今年秋季上市。与三星、Gentle Monster、Warby Parker 等合作。通过 Gemini 提供全天候帮助,语音私密传入耳朵。示例:在咖啡店说“下单”,Gemini 自动打开 DoorDash 选择咖啡并确认。 ## Gemini for Science 汇集强大 AI 工具加速研究。新的 Labs 原型可简化日常科学任务:跟踪新论文、将研究目标转化为代码、生成新假设。 > 技术是创造力的画布,AI 将成为科学发现新黄金时代的催化剂。 Source: https://www.youtube.com/watch?v=tfx2CjqtCUI

相似文章

我们在 I/O 2026 上宣布的 100 件事

Google AI Blog

Google I/O 2026 上发布了一系列公告,包括推出先进 AI 模型 Gemini 3.5 Flash 和 Gemini Omni,以及新的开发者工具和平台更新。

I/O 2026

Google AI Blog

在 Google I/O 2026 上,Google 发布了新 AI 模型 Gemini Omni 和 Gemini 3.5 Flash,以及基于代理的开发平台 Antigravity,并推出了多项产品更新,包括 Universal Cart 和跨产品的代理功能。

Google I/O 2026 上的 13 个重大发布

The Verge

Google 在 I/O 2026 主题演讲中带来多项重大 AI 发布,包括 Gemini 3.5 和 Gemini Omni 模型系列、Gemini 应用重新设计、始终在线的 AI 助手 Spark、Android 应用的 vibe-coding,以及与 Xreal 合作推出的 Project Aura 智能眼镜更新版本。

Gemini | I/O 2026 Keynote

YouTube AI Channels

Google 在 I/O 2026 上宣布 Gemini 应用的全面重新设计(神经表现)、多模态创作模型 Gemini Omni、以及 Daily brief 和 Gemini Spark 等主动智能体功能,同时推出 macOS 版语音驱动的多文档处理能力。