Gemini 3 Flash: 为速度而生的前沿智能

Google DeepMind Blog 模型

摘要

Google 发布了 Gemini 3 Flash,这是一款快速、高性价比的 AI 模型,将 Pro 级别的推理能力与 Flash 级别的速度相结合,适用于编程、复杂分析和智能体工作流等任务。

Gemini 3 Flash 以极低的成本提供了为速度而生的前沿智能。
查看原文
查看缓存全文

缓存时间: 2026/05/08 09:25

# Gemini 3 Flash:为速度而生的前沿智能 来源:https://blog.google/products-and-platforms/products/gemini/gemini-3-flash/ Gemini 3 Flash 是我们最新的模型,拥有为速度而设计的前沿智能,帮助每个人更快地学习、构建和规划任何事情。 ## 总体摘要 Google 发布了 Gemini 3 Flash,这是一款为速度而设计的快速且经济高效的模型。您现在可以通过 Gemini 应用和搜索中的 AI 模式访问 Gemini 3 Flash。开发者可以通过 Google AI Studio、Google Antigravity、Gemini CLI、Android Studio、Vertex AI 和 Gemini Enterprise 中的 Gemini API 访问它。 摘要由 Google AI 生成。生成式 AI 处于实验阶段。 ## 要点 - "Gemini 3 Flash:为速度而生的前沿智能" 介绍了一款快速、高效的 AI 模型。 - Gemini 3 Flash 提供 Pro 级别的推理能力,同时具备 Flash 级别的速度和更低的成本。 - 它非常适合编码、复杂分析和交互式应用中的快速响应。 - Gemini 3 Flash 现已成为 Gemini 应用和搜索中 AI 模式的默认模型。 - 开发者和普通用户可以通过各种 Google 平台访问 Gemini 3 Flash。 摘要由 Google AI 生成。生成式 AI 处于实验阶段。 #### 探索其他风格: Gemini 3 Flash 文本 您的浏览器不支持音频元素。 收听文章 此内容由 Google AI 生成。生成式 AI 处于实验阶段 [[duration]] 分钟 今天,我们通过发布 Gemini 3 Flash 扩展了 Gemini 3 模型家族,它以极低的成本提供为速度而设计的前沿智能。通过此次发布,我们让 Gemini 3 的下一代智能普及到 Google 产品中的每个人。 上个月,我们推出了 Gemini 3 Pro (https://blog.google/products/gemini/gemini-3/#note-from-ceo) 和 Gemini 3 Deep Think (https://blog.google/products/gemini/gemini-3-deep-think/) 模式,反响令人难以置信。自发布以来,我们的 API 每天处理超过 1T token。我们看到您使用 Gemini 3 进行代码模拟 (https://x.com/googleaidevs/status/1991333601959350306) 来学习复杂主题,构建和设计交互式游戏 (https://x.com/googleaidevs/status/1991318283065131160),以及理解各种多模态内容 (https://x.com/googleaidevs/status/1997033279610818745?s=20)。 通过 Gemini 3,我们在复杂推理、多模态和视觉理解 (https://blog.google/technology/developers/gemini-3-pro-vision/) 以及代理式和 vibe coding 任务方面引入了前沿性能。Gemini 3 Flash 保留了这一基础,将 Gemini 3 的 Pro 级别推理与 Flash 级别的延迟、效率和成本相结合。它不仅通过改进的推理支持日常任务,还是我们用于代理式工作流最令人印象深刻的模型。 从今天开始,Gemini 3 Flash 正在向全球数百万用户推出: - 面向开发者,通过 Gemini API 在 Google AI Studio (https://blog.google/technology/developers/build-with-gemini-3-flash)、Gemini CLI (https://developers.googleblog.com/gemini-3-flash-is-now-available-in-gemini-cli/) 以及我们新的代理式开发平台 Google Antigravity (https://antigravity.google/blog/gemini-3-flash-in-google-antigravity) - 面向所有人,通过 Gemini 应用 (https://blog.google/products/gemini/gemini-3-flash-gemini-app/) 和搜索中的 AI 模式 (https://blog.google/products/search/google-ai-mode-update-gemini-3-flash) - 面向企业,在 Vertex AI 和 Gemini Enterprise (https://cloud.google.com/blog/products/ai-machine-learning/gemini-3-flash-for-enterprises) ## Gemini 3 Flash:规模化前沿智能 Gemini 3 Flash 证明速度和规模不必以牺牲智能为代价。它在 GPQA Diamond(90.4%)和 Humanity's Last Exam(33.7%,无工具)等博士级推理和知识基准测试中表现优异,达到前沿性能,可与更大的前沿模型相媲美,并在多项基准测试中显著优于最好的 2.5 模型 Gemini 2.5 Pro。它在 MMMU Pro 上也达到了最先进的性能,令人印象深刻地获得了 81.2% 的分数,可与 Gemini 3 Pro 媲美。 一个基准比较表,显示了包括 Gemini 3 Flash、Gemini 3 Pro Thinking、Gemini 2.5 Flash Thinking、Gemini 2.5 Pro Thinking、Claude Sonnet 4.5、GPT-5.2 Extra high 和 Grok 4.1 Fast 在内的多个语言模型的性能分数和价格,涵盖学术推理、科学知识、数学、多模态理解、编码和长上下文性能等任务。 除了其前沿级别的推理和多模态能力外,Gemini 3 Flash 还被设计为高度高效,推动质量与成本、速度的帕累托前沿。在处理最高思考级别时,Gemini 3 Flash 能够调节其思考量。对于更复杂的用例,它可能会思考更长时间,但在典型流量下,它平均比 2.5 Pro 少用 30% 的 token,以更高的性能准确完成日常任务。 Gemini 3 Flash 在推动性能与成本、速度的帕累托前沿。 这里的性能通过 LMArena (https://lmarena.ai/) Elo 分数来衡量。 一个散点图,显示各种语言模型的 LMArena Elo 分数与每百万 token 价格的关系,一条线突出显示了通过 'gemini-3-pro'、'gemini-3-flash' 和 'gemini-3-flash-lite' 的帕累托前沿。 Gemini 3 Flash 的优势在于其原始速度,建立在开发者和消费者已经喜爱的 Flash 系列基础之上。它的性能优于 2.5 Pro,同时速度快 3 倍(基于 Artificial Analysis (https://artificialanalysis.ai/models/gemini-3-flash-reasoning) 基准测试),而成本仅为其一小部分。Gemini 3 Flash 的定价为每 1M 输入 token 0.50 美元,每 1M 输出 token 3 美元(音频输入保持每 1M 输入 token 1 美元)。 ## 面向开发者:跟得上的智能 Gemini 3 Flash 专为迭代开发而设计,提供 Gemini 3 的 Pro 级别编码性能和低延迟——它能够在高频工作流中快速推理和解决任务。在 SWE-bench Verified 上,这是一个评估编码代理能力的基准测试,Gemini 3 Flash 获得了 78% 的分数,不仅优于 2.5 系列,还优于 Gemini 3 Pro。它为代理式编码、生产就绪系统和响应式交互应用实现了理想的平衡。 Gemini 3 Flash 在推理、工具使用和多模态能力方面的强劲表现,非常适合希望进行更复杂视频分析、数据提取和视觉问答的开发者,这意味着它可以支持更智能的应用——如游戏内助手或 A/B 测试实验——这些应用既需要快速响应又需要深度推理。 我们已经收到了使用 Gemini 3 Flash 的公司的热烈反响。JetBrains、Bridgewater Associates 和 Figma 等公司已经开始使用它来转变业务,认识到其推理速度、效率和推理能力与更大模型相当。Gemini 3 Flash 今天已通过 Vertex AI 和 Gemini Enterprise 向企业开放。 ## 面向所有人:Gemini 3 Flash 全球推出 Gemini 3 Flash 现已成为 Gemini 应用中的默认模型,取代了 2.5 Flash。这意味着我们全球的 Gemini 用户都可以免费获得 Gemini 3 体验,让他们的日常任务得到重大升级。 由于 Gemini 3 Flash 令人难以置信的多模态推理能力,您可以用它来帮助您更快地查看、聆听和理解任何类型的信息。例如,您可以让 Gemini 理解您的视频和图像,并在几秒钟内将该内容转化为有用且可操作的计划。 或者,您可以使用语音快速从零构建有趣、有用的应用,无需先前的编码知识。只需在旅途中向 Gemini 口述,它就可以在几分钟内将您的非结构化想法转化为可运行的应用。 Gemini 3 Flash 也开始作为搜索中 AI 模式的默认模型向全球所有人推出。 基于 Gemini 3 Pro 的推理能力,搭载 Gemini 3 Flash 的 AI 模式在解析问题细微差别方面更加强大。它考虑查询的每个方面,以提供经过深思熟虑、全面的响应,这些响应在视觉上易于理解——从整个网络提取实时本地信息和有用的链接。结果有效地将研究与即时行动相结合:您获得智能组织的细分以及具体建议——以搜索的速度。 这在处理具有多个考量的复杂目标时尤为出色,比如规划最后一刻的旅行或快速学习复杂的教育概念。 ## 立即试用 Gemini 3 Flash Gemini 3 Flash 现已在 Google AI Studio、Google Antigravity (https://antigravity.google/)、Vertex AI (https://cloud.google.com/vertex-ai?e=48754805) 和 Gemini Enterprise (https://cloud.google.com/gemini-enterprise?e=48754805) 的 Gemini API (https://ai.google.dev/gemini-api/docs/models#gemini-3-flash) 中提供预览版。您还可以通过 Gemini CLI (https://developers.googleblog.com/gemini-3-flash-is-now-available-in-gemini-cli/) 和 Android Studio (https://android-developers.googleblog.com/2025/12/build-smarter-apps-with-gemini-3-flash) 等其他开发者工具访问它。它也开始向 Gemini 应用 (https://gemini.google.com/) 和搜索中的 AI 模式 (https://www.google.com/search?udm=50&aep=11) 中的所有人推出,免费带来对下一代智能的快速访问。 我们期待看到您用这扩展的模型家族实现什么:Gemini 3 Pro、Gemini 3 Deep Think 以及现在的 Gemini 3 Flash。

相似文章

Gemini 3.5:前沿智能与行动力

Google DeepMind Blog

Google 发布 Gemini 3.5,一个全新 AI 模型系列,聚焦智能体工作流与编程,首发 3.5 Flash 以高速提供前沿性能。

Gemini 3.1 Flash-Lite:为大规模智能而生

Google DeepMind Blog

Google 推出 Gemini 3.1 Flash-Lite,这是一款高速、高性价比的 AI 模型,现可通过 Google AI Studio 和 Vertex API 预览使用,专为高并发开发者工作负载而设计。

Gemini 3.1 Flash-Lite

Product Hunt

Google发布Gemini 3.1 Flash-Lite,这是Gemini模型的轻量级版本,专为高容量AI流水线设计。