首页
/
事件
/
I/O 2026:欢迎进入智能体Gemini时代
I/O 2026:欢迎进入智能体Gemini时代
摘要
谷歌CEO Sundar Pichai在I/O 2026上宣布了智能体Gemini时代,强调了token处理、新模型和AI代理的巨大增长。
<img src="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/SundarKeynote-hero.max-600x600.format-webp.webp">来自Google I/O的最新消息:了解我们如何借助Gemini帮助您提高效率。
查看缓存全文
缓存时间:
2026/05/19 19:15
# I/O 2026:欢迎来到自主智能的Gemini时代
来源:https://blog.google/innovation-and-ai/sundar-pichai-io-2026/
以下是我们如何帮助您通过Gemini完成更多事情的介绍。
一系列彩色图标在黑色背景上代表Google I/O
在本故事中
- AI与产品动能 (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/#momentum)
- 对话式AI (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/#conversational-ai)
- 基础设施与创新 (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/#infrastructure-innovation)
- Gemini模型 (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/#gemini-models)
- 智能体 (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/#agents)
- 来自我们自主智能Gemini时代的更多资讯 (https://blog.google/innovation-and-ai/sundar-pichai-io-2026/#more-news)
*编者按:以下是谷歌CEO Sundar Pichai在Google I/O 2026上演讲的编辑实录,经过改编以纳入更多现场宣布的内容。请在我们的**专题页面** (https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/) 查看所有公告。*
自上次I/O大会以来,这是非凡的一年,充满了持续的产品发布、技术进步和高速发展。我们现在处于AI周期的一个阶段,人们希望在日常生活中使用的产品中看到实际价值。我们一直专注于这一点,您将在今天I/O上宣布的产品和功能中看到这一点。
自从十年前我们决定将公司转向“AI优先”战略以来,我们仍然认为AI是实现我们使命、大规模改善人们生活的最深远方式。这就是为什么我们采取了差异化的全栈式AI创新方法,从我们的定制芯片和安全基础,到世界级的研究和模型,再到触及数十亿用户的产品和平台。这种方法使我们能够以更快的速度迭代和创新,从而激活公司的每一个角落。
令人难以置信的是人们如何使用AI,无论是学生用Gemini应用备战期末考试,音乐家和艺术家使用Lyria和Veo等生成式AI模型作为创作流程的一部分,还是开发者编写代码并将他们的想法变为现实。
## 全栈AI动能
这些关于人们如何使用AI的故事,是衡量进步的最佳标准。要了解人们采用AI的规模,还有一个很好的指标——令牌(tokens),这是我们模型处理的基本数据单元,每个令牌都代表一个正在解决的问题。
两年前,我们在所有平台上每月处理9.7万亿个令牌——这是一个巨大的数字。去年在I/O上,这个数字增长到大约480万亿个令牌。而今天,这个数字又增长了7倍,达到每月超过3200万亿个令牌。
图像显示了一个折线图,标题为“我们各平台每月处理的令牌数”,展示了从2024年5月的9.7万亿到2026年5月的3200万亿以上的显著增长,并注明“同比增长7倍”。
这讲述了一个关于我们产品以及其他人(尤其是开发者和企业)如何构建的重要故事:
- 每月有超过850万开发者使用我们的模型构建新的应用和体验。
- 我们的模型API现在每分钟处理大约190亿个令牌。
- 在过去12个月中,超过375家Google Cloud客户各自处理了超过1万亿个令牌,这表明各行各业对AI有着巨大的需求。
## 产品的动能
如今我们有13个产品拥有超过10亿用户。其中5个产品拥有超过30亿用户。
我们的Gemini模型是人们更多使用我们产品、以及更频繁使用我们产品的重要原因。
这一切从**搜索** (https://blog.google/products-and-platforms/products/search/search-io-2026) 开始,它将生成式AI的好处带给全球比任何其他产品都更多的人。AI概览现在拥有超过25亿月活跃用户。AI模式是一次革命性的突破,是我们搜索历史上最大的一次升级。人们喜爱它,仅仅一年时间,它就已经拥有超过10亿月活跃用户。
当人们在搜索中使用我们的AI驱动功能时,他们会更频繁地使用搜索。搜索已经不再是单一的查询,而更像是持续的对话,为你提供更深入的见解,并让你与广阔的互联网建立连接。
我们快速创新的另一个领域是**Gemini应用** (https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/)。去年在I/O上,Gemini应用拥有4亿月活跃用户。今天,我们已经超过9亿用户,一年内翻了一番多。在同一时期,每日请求量增长了超过七倍。
我们添加了许多独特功能,例如**个性化智能** (https://blog.google/products-and-platforms/products/search/personal-intelligence-expansion/),这使得回复更加定制化和有用。到目前为止,已经使用我们的Nano Banana图像生成模型生成了超过500亿张图像。在过去一年中,它成为了一个突破性的明星,展示了世界上潜伏着多少创造力。
## 产品中的自然、对话式AI
还有很多潜在的效率有待解锁。在过去一年中,我们一直致力于将更自然的与Gemini对话的能力直接带入我们的产品中。最近,地图迎来了十年来的最大升级,包括一项名为**Ask Maps** (https://blog.google/intl/en-in/products/explore-communicate/ask-anything-about-any-place-on-maps-with-gemini/) 的新功能。人们正用Ask Maps提出更复杂、更长的提问。
现在我们正在将更自然的对话式AI带入更多产品中。
### Ask YouTube
人们每天都会来到YouTube提出很多问题。有大量优秀的视频,但有时很难知道从何开始。
Ask YouTube彻底重新构想了体验,使信息更易于消化和浏览。你会看到最符合你兴趣的视频,最重要的是,它直接跳转到与你最相关的视频部分。
一个“Ask YouTube”的搜索结果页面,回答了“如何教我的3岁孩子骑踏板自行车,他们已经会骑平衡车了?”这个问题,并展示了一个孩子骑自行车的视频。
我们现在开始测试Ask YouTube,它将于今年夏天在美国广泛推出。
### 语音驱动的Docs Live
很多时候我希望能够以我说话的速度完成任务。得益于我们音频模型的技术飞跃,这现在变得更加可行。
一项名为Docs Live的新功能将这一体验提升到了新的高度。以前用Gemini创建文档,你必须输入精确的提示。而使用Docs Live,你只需口头“倒出”你脑子里想的东西,剩下的交给Gemini。以下是实时演示:
未来,你将能够直接通过语音创建**和**编辑新文档。Docs Live将于今年夏天向订阅用户推出,届时强大的语音功能也将应用于Gmail和Keep。
## 支持规模化创新的基础设施
看到创新以如此惊人的速度在我们的产品中铺开,令人难以置信。要支持我们用户的这种规模,同时服务全球的企业和开发者,需要大规模的基础设施投资。我们一直在为现在和未来投资。2022年,我们的年度资本支出为310亿美元。今年,我们预计这个数字将大约是那时的六倍,达到约1800到1900亿美元。这项投资的关键部分是我们的定制芯片。
十年前,我们在I/O舞台上**宣布** (https://cloud.google.com/blog/products/ai-machine-learning/google-supercharges-machine-learning-tasks-with-custom-chip?e=48754805) 了我们的第一款商用张量处理单元(TPU)。自那时起,我们改变了行业为AI构建的方式。我们最近在Cloud Next上宣布了我们的**第八代TPU** (https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/)。首次,我们采用了双芯片架构,为训练和推理设计了专门的架构:TPU 8t 和 8i。
- **TPU 8t** 针对大规模预训练进行了优化,其原始计算能力是上一代的近三倍。我们对训练基础设施采用了根本不同的方法。借助JAX和Pathways,我们的训练不再受限于单个大型数据中心的限制。相反,我们现在可以无缝地在多个站点之间分布训练,将训练扩展到全球超过100万个TPU。这使我们能够创建世界上最大的训练集群。对于模型构建者来说,这意味着训练更大、能力更强的模型只需数周而非数月。
- **TPU 8i** 专为推理设计。我们在每一步都显著提高了速度。因为如果我们在27年的搜索工作中学到了什么,那就是延迟至关重要。
除了速度,我们也在考虑可持续地扩展。两款芯片都更加节能,每瓦性能提升高达两倍。
两款用于自主智能时代的芯片_英雄图
## Gemini Omni
TPU的这种进步使我们能够在模型、编码和智能体方面取得计算进展。借助世界模型,AI正在从预测文本转向模拟现实。我们一直在努力突破这些模型的能力边界。
Gemini Omni是我们的新模型,能够从任何输入生成任何输出模态的样本。我们从视频输出开始,随着时间的推移,我们将实现图像和文本。这个新模型结合了Gemini的智能与我们的生成式媒体模型——这是世界理解的一次巨大飞跃。我们正在推出Omni系列中的第一个模型:Gemini Omni Flash。
Gemini Omni Flash从今天开始可用。你可以在Gemini应用、**Google Flow** (https://blog.google/innovation-and-ai/models-and-research/google-labs/flow-updates) 以及YouTube Shorts中试用它。我们将在未来几周内通过API向开发者和企业客户推出。
一个展示Gemini Omni的YouTube视频
## 新的SynthID更新和合作伙伴
随着生成式AI越来越好,对更高透明度的需求也越来越大。研究表明,人们只有大约四分之一的时间能够正确识别高质量的深度伪造视频。三年前,我们推出了**SynthID** (https://deepmind.google/blog/identifying-ai-generated-images-with-synthid/),这是一种肉眼不可见的水印。自推出以来,SynthID已经为超过1000亿张图像和视频,以及六万年的音频资产添加了水印。
数百万人正在Gemini应用中使用我们的SynthID检测器来验证AI生成的内容。现在我们更进一步,在产品中增加**Content Credentials验证** (https://contentcredentials.org/)。这将向你显示内容的来源是AI还是相机,以及是否使用生成式AI工具编辑过。我们希望更多人能轻松获得这些工具,因此我们正在将Content Credentials和SynthID验证扩展到搜索和Chrome。
当然,这只有在更多合作伙伴决定为他们自己的AI生成内容添加水印时才能大规模发挥作用。**Nvidia** (https://blog.google/innovation-and-ai/products/google-nvidia-gtc-ai/) 去年签约采用了SynthID。今天,我们非常高兴地宣布,OpenAI、Kakao和Eleven Labs也将采用SynthID。很高兴看到跨行业的合作。我们期待扩展到更多合作伙伴,并为AI时代设定透明度标准。
## Gemini 3.5 Flash
Gemini 3在几个月前发布,包含完整的模型系列。这是我们迄今为止采用最广泛的系列。我们很高兴看到开发者将Flash作为日常驱动,并使用Pro的深度推理和多模态能力构建出色的体验。我们一直在努力改进这些模型,尤其专注于自主智能编码、长周期任务和真实世界工作流。
今天,我们推出**Gemini 3.5 Flash** (https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/),这是我们系列中第一个结合前沿智能与行动的模型。我要强调两点:
- 与3.1 Pro相比,3.5 Flash在几乎所有基准测试中都表现更好。它在编码方面取得了巨大进步——看看**GDPVal** (https://artificialanalysis.ai/evaluations/gdpval-aa) 的惊人提升。这涵盖了许多真实世界中具有经济价值的任务。
- Gemini 3.5 Flash是一个非常强大的模型,处于前沿水平,与最好的模型相当,但速度仍然非常快。这就是为什么当你比较智能与输出速度时,它在右上角象限中独树一帜。在输出令牌/秒方面,它比其他前沿模型快四倍。
图像显示了一个散点图,标题为“Artificial Analysis智能指数 vs 输出速度”,y轴为Artificial Analysis智能指数,x轴为输出速度(令牌/秒),图中标绘了GPT-5.5 (xhigh)、Claude Opus 4.7 (max) 和3.5 Flash等模型的数据点,其中3.5 Flash被蓝色阴影框突出显示,代表高智能和高速度。
新模型对谷歌内部来说是一个游戏规则改变者。我们一直使用3.5 Flash配合我们重新构想的AI优先开发平台Antigravity,这显著加速了我们的构建过程。今年3月,我们内部AI开发者工具每天处理5000亿个令牌,并且每几周就翻一番。现在,我们每天处理超过3万亿个令牌。这种规模创造了一个强大的反馈循环,帮助我们改进3.5。
gemini-3-5__关键字+声明__元卡片__浅色背景
Flash的惊人之处在于,它以不到同类前沿模型一半的价格提供了前沿级别的能力。我们听说许多公司已经用完了他们全年的令牌预算,而现在才五月。如果公司混合使用Flash和其他前沿模型,他们可以节省大量资金。换个角度看,顶尖公司每天处理约1万亿个令牌。如果他们将80%的工作负载从其他前沿模型转移到3.5 Flash,他们每年将节省超过10亿美元。这些省下来的钱可以重新投入到公司中。
Gemini 3.5 Flash今天在我们的产品和API中向所有人开放。我们也很期待Gemini 3.5 Pro。我们正在内部使用它,它显示出巨大的改进,将于下个月推出。
## Antigravity 2.0
我们还将3.5 Flash通过Antigravity带给开发者。
Antigravity正在超越编码环境,转变为一个开发和托管自主AI智能体集群的平台。这包括Antigravity 2.0,一个全新的独立桌面应用,作为智能体交互的中心,任何人都可以编排智能体来执行各种任务。我们还开发了更优化的Flash版本:不仅是4倍,而是比其他前沿模型快12倍。
Antigravity用户从今天开始可以体验这个功能。**在此处阅读关于Antigravity 2.0的更多信息** (https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-developer-highlights)。
## Gemini Spark 是你的全天候智能体
Gemini 3.5和Antigravity正在开启一个智能体和自主智能能力的新世界。我们一直在为开发者和企业提供智能体。现在我们正全力专注于以安全可靠的方式将智能体的力量带给消费者,
相似文章
Wired
Google 在 I/O 2026 主题演讲中宣布了新的智能 AI 功能、Gemini 3.5 模型更新、带生成式 UI 的智能搜索框以及基于 Android 的智能眼镜,旨在将 AI 代理嵌入其各项服务中。
Google AI Blog
在 Google I/O 2026 上,Google 发布了新 AI 模型 Gemini Omni 和 Gemini 3.5 Flash,以及基于代理的开发平台 Antigravity,并推出了多项产品更新,包括 Universal Cart 和跨产品的代理功能。
X AI KOLs Following
Google I/O 2026 公布了重大开发者更新,包括 Gemini 3.5 Flash(性能提升4倍)、用于智能体开发的 Antigravity 2.0 CLI 以及 AI Studio 移动应用,标志着向智能体时代的转变。
YouTube AI Channels
Sundar Pichai opened Google I/O 2026 with highlights of AI token processing reaching 3.2 quintillion per month, new TPU 80/80i chips, the Gemini Omni world model, and multiple product updates, emphasizing full-stack AI innovation.
Google DeepMind Blog
Google DeepMind 推出 Gemini 2.0,这是一款新型智能体 AI 模型,具备原生图像和音频输出、增强的工具使用能力和多模态功能,专为下一代 AI 智能体设计。Gemini 2.0 Flash 现已向开发者推出,计划于 2025 年初实现更广泛的可用性。