谷歌发布针对智能体优化的 Gemini 3.5 Flash 及名为 Omni 的万能模型

Ars Technica 2026/05/19 18:11 模型

gemini-3-5-flash omni google agentic-ai code-generation efficiency frontier-models

摘要

谷歌发布 Gemini 3.5 Flash，一款针对智能体任务优化的高效前沿模型，以及名为 Omni 的万能模型，声称在速度和编码性能上实现突破。

在去年的 I/O 大会上，谷歌还在谈论 Gemini 的 <a href="https://arstechnica.com/gadgets/2025/05/gemini-2-5-is-leaving-preview-just-in-time-for-googles-new-250-ai-subscription/">2.5 分支</a>，而一年间变化巨大。自那以后，我们经历了 <a href="https://arstechnica.com/google/2025/11/google-unveils-gemini-3-ai-model-and-ai-first-ide-called-antigravity/">3.0</a> 和 <a href="https://arstechnica.com/google/2026/02/google-announces-gemini-3-1-pro-says-its-better-at-complex-problem-solving/">3.1</a> 系列，现在已进入 3.5 版本。Gemini 3.5 Flash 于今天开始在众多谷歌产品中推出，谷歌再次声称该模型甚至优于上一代 Pro 模型。 这已成为谷歌过去一年 tick-tock 模式更新的趋势，但团队表示此次发布具有特殊意义。据称 Gemini 3.5 Flash 在提供前沿级别智能的同时，效率也足够高，最终可能使复杂的智能体任务值得大规模实施。Gemini 产品管理高级总监 Tulsee Doshi 解释说，Gemini 3.5 Flash 的创新将贯穿多个谷歌产品，而这仅仅是个开始。 <a href="https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis.jpg"><img width="1920" height="1080" src="https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis.jpg" class="fullwidth full" alt="" decoding="async" loading="lazy" srcset="https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis.jpg 1920w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-640x360.jpg 640w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-1024x576.jpg 1024w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-768x432.jpg 768w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-1536x864.jpg 1536w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-384x216.jpg 384w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-1152x648.jpg 1152w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-980x551.jpg 980w, https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-1440x810.jpg 1440w" sizes="auto, (max-width: 1920px) 100vw, 1920px"> 图片来源： Google </a> <a href="https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/">阅读全文</a> <a href="https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/#comments">评论</a>

查看原文

查看缓存全文

缓存时间: 2026/05/19 19:13

# Gemini 3.5 Flash 或许快得足以让生成式AI变得有意义来源：https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/ 谷歌表示，其更高效的 Gemini 3.5 Flash 是通往你智能体AI未来的关键。 [](https://cdn.arstechnica.net/wp-content/uploads/2026/04/gemini-general-2.jpg) 在去年的 I/O 大会上，谷歌还在谈论 Gemini 的 2.5 分支（https://arstechnica.com/gadgets/2025/05/gemini-2-5-is-leaving-preview-just-in-time-for-googles-new-250-ai-subscription/），而一年后的今天，变化巨大。自那以后，我们先后经历了 3.0（https://arstechnica.com/google/2025/11/google-unveils-gemini-3-ai-model-and-ai-first-ide-called-antigravity/）和 3.1（https://arstechnica.com/google/2026/02/google-announces-gemini-3-1-pro-says-its-better-at-complex-problem-solving/）系列，现在迎来了 3.5 版本。Gemini 3.5 Flash 从今天开始将在大量 Google 产品中推出，谷歌再次声称，这个模型甚至比上一代的 Pro 模型还要好。过去一年中，谷歌滴答式的模型更新一直有这种趋势，但团队表示这次发布非同寻常。Gemini 3.5 Flash 据称提供了前沿水平的智能，同时效率也足够高，可能最终让复杂的智能体任务值得大规模执行。Gemini 产品管理高级总监 Tulsee Doshi 解释说，Gemini 3.5 Flash 的创新已渗透到多个 Google 产品中，而这仅仅是个开始。 https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis.jpg[https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis.jpg](https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis.jpg) 图片来源：Google 图片来源：Google 生成式 AI 目前是一个烧钱的无底洞，这已不是秘密，所有主要的 AI 玩家都在寻找提高效率的途径。当你开始构建本应运行更长时间以完成复杂任务的智能体体验时，问题会被放大。Gemini 3.5 Flash 可能是朝使这一切可行迈出的一大步。新模型每秒可以输出近 300 个 token，但其基准测试分数与构建输出速度仅为四分之一的大型前沿模型（如 3.1 Pro）相当。据 Doshi 称，团队在 Gemini 3.5 Flash 的预训练方面做了大量改进，但从开发者如何使用 Gemini 模型中获得的见解也真正开始发挥作用。 “在训练后阶段，我们真正开始解锁从用户那里获得的反馈的价值，例如来自 Antigravity 的反馈，”Doshi 说道。“这正是你在代码性能和工具使用性能方面所看到的结果。而我们的希望是，你将继续看到阶段性变化，3.5 Pro 会更好，而下一代的 Flash 将在该系列中达到 Pro 的性能。” 谷歌专注于让新模型生成代码，这是 AI 的核心智能体方向。Terminal Bench 和 SWE-Bench Pro 测试均显示出显著改进——3.5 Flash 碾压了旧版 Flash 模型，与 Gemini 3.1 Pro 相比也有微小但可衡量的提升。其分数与 OpenAI 更大更昂贵的 GPT 5.5 处于同一水平。 https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini_3-5_evals_charts_analysis-1.jpg智能体工作流的一个主要障碍是生成模型如何使用为人类设计的界面。Doshi 表示，这不是一个容易解决的问题。“某些事情，比如 UI 控制，成本很高，因为模型必须搜索页面，知道在哪里点击，并通过多个步骤来执行。我认为 Flash 能够很好地做到这一点，因为它结合了质量和成本优势。” 谷歌的 AI 评估也证明了这些改进。在谷歌当前的基准测试集合中，有 OSWorld-Verified，它测试模型在真实计算环境中处理一般任务的能力。这与编码方面的改进类似。Gemini 3.5 Flash 大幅优于旧版 Flash 模型，甚至比 Gemini 3.1 Pro 还要快一点。它与 GPT 5.5 基本持平。 [](https://cdn.arstechnica.net/wp-content/uploads/2026/05/gemini-3-5__benchmarks__light.png) 谷歌的新 Flash 模型再次比上一代 Pro 稍好一些。图片来源：Google 谷歌的新 Flash 模型再次比上一代 Pro 稍好一些。图片来源：Google Gemini 3.5 Flash 已在谷歌内部部署，Doshi 指出它产生了巨大影响。“我们有一套内部评估指标，用于衡量 Google 员工如何编写代码，即查看我们自己的代码库以及模型在这些代码库上的表现，”Doshi 说道。“你可以看到 3.1 Pro 和 3.5 Flash 之间存在巨大的、巨大的飞跃。” 谷歌去年发布了 Antigravity IDE，现在它正在升级到 2.0 版，支持 Gemini 3.5 Flash。此次更新将支持多个并行工作流——本质上是由 Gemini 3.5 Flash 生成的子智能体。谷歌再次表示，这之所以成为可能，只是因为新模型在吐出 token 方面非常高效。除了 Antigravity，Gemini 3.5 Flash 还将进入 Gemini 应用、API、AI Studio、Android Studio 以及所有 Google 企业产品。至于 Pro 版本，谷歌表示已经在内部测试中，应该在下个月准备好发布。 ## Gemini Spark 是智能体形态的 3.5 Flash 公司们正在从以“AI”作为主要流行语转向“智能体”。通过 Gemini Spark，谷歌向用户提供了其首个专用智能体。Spark 在 Google 云中全天候运行，因此不占用你的任何计算资源，也不绑定到任何特定设备或浏览器标签页。相反，它横跨你的整个 Google 足迹，使用 Gemini Flash 3.5 根据你的命令运行多个智能体工作流。谷歌并不总是能很好地解释其流行语。那么 AI 智能体到底是什么？谷歌的 Doshi 解释道：“我认为智能体能够将一个模型加上一个‘套件’（软件接口）结合起来，使得这个组合实际上能够代表你采取行动。” 使用 Spark，你可以给 AI 下达指令，它来处理任务。这可以随着时间的推移进行，因为智能体会从你的 Drive 文件、Gmail 等处获取上下文。你可以让它监控特定邮件并将其整合到每日摘要中，或者让它监控你的会议并生成总结和待办事项。Spark 还可以向你发送通知或提出后续问题，以更好地满足你的需求。谷歌强调，它被设计为在执行“高风险操作”之前征求你的批准。 https://cdn.arstechnica.net/wp-content/uploads/2026/05/GeminiSparkAvailabillity.001.jpeg[https://cdn.arstechnica.net/wp-content/uploads/2026/05/GeminiSparkAvailabillity.001.jpeg](https://cdn.arstechnica.net/wp-content/uploads/2026/05/GeminiSparkAvailabillity.001.jpeg) 图片来源：Google 图片来源：Google Doshi 表示，在过去的几周内部测试中，她每天都使用 Gemini Spark，用于个人和工作任务。她提供了两个她使用 Spark 智能体的例子。在 I/O 大会筹备期间，她使用 Spark 收集有关 3.5 Flash 的评估和其他统计数据，为 Google 高层制作幻灯片。“结果非常漂亮，”她说。“可能比我原本能做到的更好，而且用时更短。” 在个人方面，她创建了一个智能体来追踪她新生儿的发育里程碑。该智能体提供关于数据的见解，并建议其他值得追踪的指标。“我在像对待 AI 模型一样对待我的孩子，”Doshi 开玩笑说。“我意识到这一点，但这非常有用。” 很多人可能会对向在 Google 云中运行的 AI 模型提供这么多个人数据嗤之以鼻，但如果这些东西变得真正有用，人们的观念可能会调整。如今人们与 Google 分享数据的许多方式在 10 或 15 年前是不可想象的。 Spark 将从下周开始向 AI Ultra 订阅用户推出。谷歌增加了一个新的 Ultra 层级，可以让你使用最新功能。它的费用是每月 100 美元，大多数人仍然认为这对 AI 工具来说是一笔天文数字，但每月 200 美元的层级（比以前低了 50 美元）仍然存在，供那些想要更高 token 限额的用户使用。谷歌表示，计划将来向所有用户（甚至那些不付费使用 Gemini 的用户）推出 Spark。 ## Gemini Omni：一个全能模型（最终） Veo 3，谷歌那个令人担忧地优秀（https://arstechnica.com/ai/2025/05/ai-video-just-took-a-startling-leap-in-realism-are-we-doomed/）的视频模型，在去年的 I/O 大会上首次亮相，但今年有了一个新的视频生成器。Gemini Omni Flash 将在 Gemini 应用、YouTube 和 Flow 等产品中取代 Veo。谷歌表示，Omni 被设计为真正的多模态，因此它可以接受任何类型的输入数据，并生成你想要的任何内容——图像、文本、视频或音频。不过，目前它还不能做到大部分。谷歌从视频开始，因此与 Veo 进行了交换。虽然它与新的 Gemini 3.5 模型相似，但 Omni Flash 并非明确属于那个分支。这是谷歌的独特产物，可能代表着公司 AI 的新方向。“Gemini 的愿景一直是多模态输入、多模态输出，”Doshi 说道。“Omni 是向这一愿景迈出的一步。” 由 Gemini Omni 创建的 AI 视频示例。由 Gemini Omni 创建的 AI 视频示例。目前，你需要连接到执行所需任务的模型。对于图像，谷歌会将你的提示路由到 Nano Banana。如果你想要音乐，你的输入会进入 Lyria。开发者必须连接到正确的 API，而且并非所有模型都在所有工具中可用。有朝一日，一切都可能通过像 Omni 这样的统一模型来处理，但现在还为时过早，Gemini 团队还不确定 Omni 将如何发展。接下来的几个月将具有启示意义，因为谷歌会考虑将 Omni 模型开放给更多输出类型，以观察它与谷歌其他模型相比的表现。“我们可能会发现，某些用例确实受益于其自己的定制模型和特定重点，”Doshi 说。“目前还没有完全证明，在接下来的几个月里，我们可以将所有内容整合到一个体验中。” 第一个 Omni 版本是 Flash 模型，这意味着它比前沿的 Pro 模型要小。谷歌确实打算在某个时候发布 Omni Pro 模型，但没有时间表。如果 Omni 的多模态能力能够整合，这些模型最终可能成为未来 Gemini 版本的基础，以简化谷歌的 AI 生态系统。 Ryan Whitwam 的照片（https://arstechnica.com/author/ryanwhitwam/） Ryan Whitwam 是 Ars Technica 的高级科技记者，报道谷歌、AI 和移动技术如何持续改变世界。在他 20 年的职业生涯中，他为 Android Police、ExtremeTech、Wirecutter、纽约时报等多家媒体撰稿。他评测过的手机比大多数人一辈子拥有的还要多。你可以关注他的 Bluesky（https://bsky.app/profile/rwhitwam.bsky.social），在那里你会看到他几十个机械键盘的照片。 24 条评论（https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/#comments） 1. “最多阅读”中第一篇故事的列表图片：埃博拉疫情：世卫组织宣布紧急状态，美国限制旅行，一名美国人感染（https://arstechnica.com/health/2026/05/ebola-outbreak-who-declares-emergency-us-restricts-travel-american-infected/）

谷歌发布针对智能体优化的 Gemini 3.5 Flash 及名为 Omni 的万能模型

相似文章

Gemini Omni 和 Gemini 3.5 的 9 个实际演示

Gemini 3.5：前沿智能与行动力

I/O 2026

Gemini 3 Flash: 为速度而生的前沿智能

借助 Gemini 3.5 Flash，谷歌将下一波 AI 押注在智能体而非聊天机器人上

提交意见反馈