Gemini | I/O 2026 Keynote

YouTube AI Channels 产品

摘要

Google 在 I/O 2026 上宣布 Gemini 应用的全面重新设计(神经表现)、多模态创作模型 Gemini Omni、以及 Daily brief 和 Gemini Spark 等主动智能体功能,同时推出 macOS 版语音驱动的多文档处理能力。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/23 07:10

**TL;DR:** Google 在 I/O 2026 上宣布了 Gemini 应用的全面重新设计(神经表现)、全新的 Gemini Omni 多模态创作模型、以及 Daily brief 和 Gemini Spark 等主动智能体功能,同时 macOS 版也迎来了语音驱动的多文档处理能力。 ## 重新设计的 Gemini 体验:神经表现 过去一个夏天,Gemini 月度活跃用户已超过 9 亿,覆盖全球 230 多个国家和地区、支持 70 多种语言。本次 I/O 的第一个重大更新是**从零开始完全重新设计的 Gemini 应用**,采用名为“神经表现”(neural expressive)的设计语言,包含流畅动画、鲜艳色彩、全新排版和触觉反馈。 设计不仅关乎外观,更关乎使用方式。新版本让生成图像、视频和音乐更简单,内置了易于混音的模板。Gemini Live 体验也得到彻底改造:现在可以立即内联打开,未来几周还将推出更多地区方言选项(如利物浦口音、葡萄牙语不同变体)。 最核心的变化是模型响应的呈现方式:不再显示成片文字,而是由 Gemini 实时为你布置响应(类似搜索中的生成式 UI)。滚动时可能看到由 Gemini 定制生成的交互式图像、可快速浏览的时间线或嵌入式视频。该体验即刻起在 Android、iOS 和 Web 上全球同步推出。 ## Gemini Omni:多模态创作进入新阶段 第二个更新是 **Gemini Omni**,今天起向付费订阅用户(Google AI Plus、Pro、Ultra)开放,直接集成在 Gemini 应用中。它支持任意组合的文本、图像和视频输入,将想法变为现实。 演讲者展示了 Sasha 的例子:她上传原始视频,添加参考视觉素材,可以改变视频风格,甚至将摄像机角度切换到 360 度镜头。Gemini 理解动作的物理规律,并智能地将效果叠加到现实世界中,同时保留镜头的灵魂。演讲者称之为“视频领域的 Nano banana 时刻”——创作、混音、编辑视频从未如此简单。 ## 智能体:从回答问题到主动为你工作 第三个更新聚焦于智能体如何融入 Gemini。随着模型升级到 Gemini 3.5 Flash(3.5 Pro 即将到来),智能体不仅能回答问题,还能主动为你工作。现场发布了两个开箱即用的智能体: ### Daily brief(每日简报) 个性化摘要,旨在成为用户每天早晨的第一站。它整合收件箱、日历、任务等信息,找出最重要的事项(如提醒还书),按主题组织并建议下一步行动。用户可在行内直接执行后续操作。今日起在美国向 Google AI Plus、Pro、Ultra 订阅用户推出。 ### Gemini Spark(自定义工作流) 高级用户可以使用 Gemini Spark 创建自己的工作流。它可跨设备同步,某些任务要求用户确认,不会擅自执行不希望的操作。例如,创建一个“学年规划清单”的文档,利用 Google Docs 全部格式化功能,显示各孩子的清单、日期、活动、颜色编码。Spark 将从本周起向受信任测试者推出,下周在美国以 Beta 版形式向 Google AI Ultra 订阅用户推出,还将带到 Gemini Workspace 和 Gemini Enterprise。 未来的路线图还包括 MCP 集成,使 Spark 能更主动地处理任务——例如发现用户周六负责孩子的 T 球比赛零食时,主动设置 Instacart 订单并记得选择无坚果零食。多个合作伙伴将在整个夏天与 Spark 集成。 ## macOS 应用:语音驱动的多文档处理 作为额外惊喜,团队演示了 macOS 版 Gemini 的新能力。上个月推出的原生应用(使用反重力技术从零构建,不到 100 天实现 100 多个功能)现在支持:在 Finder 中选择多个文档(PDF、发票图像等),长按功能键并用语音指令让 Gemini 处理。例如,用户说“发送给寄养所的邮件,包含狗狗的详细信息、过敏史、疫苗,整理成表格,语气友好”,Gemini 能同时理解语音和选中的文件,自动纠正口语错误(如周四改为周五),内联生成表格。这些新语音能力及 Gemini Spark 将在今年夏天登陆 Mac 应用。 ## 总结 今天发布的三个核心更新(神经表现设计、Gemini Omni、智能体)加上 mac 端的惊喜,让 Gemini 更接近“万能助手”的愿景——个性化、主动、强大,适用于学生、忙碌家长和小企业主。 **Source:** [Gemini | I/O 2026 Keynote – YouTube](https://www.youtube.com/watch?v=7Z5Vy9JBANs)

相似文章

I/O '26 Recap: Everything You Need to Know

YouTube AI Channels

Google I/O 2026 大会发布了 Gemini 3.5 Flash/Pro、Gemini Omni 多模态模型、Anti-Gravity 智能体平台、Gemini Spark 个人 AI 以及搜索购物等全面升级,强调全栈 AI 创新与科学应用,展示了一系列新体验和硬件产品。

Gemini Omni | I/O 2026 Keynote

YouTube AI Channels

Google在I/O 2026上发布Gemini Omni,一个能够从任何输入生成任何输出的新模型,结合世界知识与生成式媒体,实现对话式视频编辑和创意变形,首先推出Gemini Omni Flash。

Gemini Spark | I/O 2026 Keynote

YouTube AI Channels

Google 在 I/O 2026 上发布了 Gemini Spark,这是一个能在后台自动执行跨应用任务的智能代理助手,支持起草邮件、管理社区活动、创建文档等,并从本周起向受信任测试者推出,下周面向 AI Ultra 订阅用户开放 Beta 版。

Google I/O '26 Keynote

YouTube AI Channels

Google I/O '26 主题演讲展示了AI全面提速:月处理3.2千万亿Token,Gemini月活超9亿,发布新一代TPU芯片及世界模型Gemini Omni,并推出Ask YouTube、Docs Live等对话式AI功能。

Google I/O 2026 上的 13 个重大发布

The Verge

Google 在 I/O 2026 主题演讲中带来多项重大 AI 发布,包括 Gemini 3.5 和 Gemini Omni 模型系列、Gemini 应用重新设计、始终在线的 AI 助手 Spark、Android 应用的 vibe-coding,以及与 Xreal 合作推出的 Project Aura 智能眼镜更新版本。