Gemini 3 Flash: 为速度而生的前沿智能

Google DeepMind Blog 2025/12/17 11:58 模型

gemini-3-flash google-ai large-language-model reasoning agentic-ai speed-optimization vertex-ai

摘要

Google 发布了 Gemini 3 Flash，这是一款快速、高性价比的 AI 模型，将 Pro 级别的推理能力与 Flash 级别的速度相结合，适用于编程、复杂分析和智能体工作流等任务。

Gemini 3 Flash 以极低的成本提供了为速度而生的前沿智能。

查看原文

查看缓存全文

缓存时间: 2026/05/08 09:25

# Gemini 3 Flash：为速度而生的前沿智能来源：https://blog.google/products-and-platforms/products/gemini/gemini-3-flash/ Gemini 3 Flash 是我们最新的模型，拥有为速度而设计的前沿智能，帮助每个人更快地学习、构建和规划任何事情。 ## 总体摘要 Google 发布了 Gemini 3 Flash，这是一款为速度而设计的快速且经济高效的模型。您现在可以通过 Gemini 应用和搜索中的 AI 模式访问 Gemini 3 Flash。开发者可以通过 Google AI Studio、Google Antigravity、Gemini CLI、Android Studio、Vertex AI 和 Gemini Enterprise 中的 Gemini API 访问它。摘要由 Google AI 生成。生成式 AI 处于实验阶段。 ## 要点 - "Gemini 3 Flash：为速度而生的前沿智能" 介绍了一款快速、高效的 AI 模型。 - Gemini 3 Flash 提供 Pro 级别的推理能力，同时具备 Flash 级别的速度和更低的成本。 - 它非常适合编码、复杂分析和交互式应用中的快速响应。 - Gemini 3 Flash 现已成为 Gemini 应用和搜索中 AI 模式的默认模型。 - 开发者和普通用户可以通过各种 Google 平台访问 Gemini 3 Flash。摘要由 Google AI 生成。生成式 AI 处于实验阶段。 #### 探索其他风格： Gemini 3 Flash 文本您的浏览器不支持音频元素。收听文章此内容由 Google AI 生成。生成式 AI 处于实验阶段 [[duration]] 分钟今天，我们通过发布 Gemini 3 Flash 扩展了 Gemini 3 模型家族，它以极低的成本提供为速度而设计的前沿智能。通过此次发布，我们让 Gemini 3 的下一代智能普及到 Google 产品中的每个人。上个月，我们推出了 Gemini 3 Pro (https://blog.google/products/gemini/gemini-3/#note-from-ceo) 和 Gemini 3 Deep Think (https://blog.google/products/gemini/gemini-3-deep-think/) 模式，反响令人难以置信。自发布以来，我们的 API 每天处理超过 1T token。我们看到您使用 Gemini 3 进行代码模拟 (https://x.com/googleaidevs/status/1991333601959350306) 来学习复杂主题，构建和设计交互式游戏 (https://x.com/googleaidevs/status/1991318283065131160)，以及理解各种多模态内容 (https://x.com/googleaidevs/status/1997033279610818745?s=20)。通过 Gemini 3，我们在复杂推理、多模态和视觉理解 (https://blog.google/technology/developers/gemini-3-pro-vision/) 以及代理式和 vibe coding 任务方面引入了前沿性能。Gemini 3 Flash 保留了这一基础，将 Gemini 3 的 Pro 级别推理与 Flash 级别的延迟、效率和成本相结合。它不仅通过改进的推理支持日常任务，还是我们用于代理式工作流最令人印象深刻的模型。从今天开始，Gemini 3 Flash 正在向全球数百万用户推出： - 面向开发者，通过 Gemini API 在 Google AI Studio (https://blog.google/technology/developers/build-with-gemini-3-flash)、Gemini CLI (https://developers.googleblog.com/gemini-3-flash-is-now-available-in-gemini-cli/) 以及我们新的代理式开发平台 Google Antigravity (https://antigravity.google/blog/gemini-3-flash-in-google-antigravity) - 面向所有人，通过 Gemini 应用 (https://blog.google/products/gemini/gemini-3-flash-gemini-app/) 和搜索中的 AI 模式 (https://blog.google/products/search/google-ai-mode-update-gemini-3-flash) - 面向企业，在 Vertex AI 和 Gemini Enterprise (https://cloud.google.com/blog/products/ai-machine-learning/gemini-3-flash-for-enterprises) ## Gemini 3 Flash：规模化前沿智能 Gemini 3 Flash 证明速度和规模不必以牺牲智能为代价。它在 GPQA Diamond（90.4%）和 Humanity's Last Exam（33.7%，无工具）等博士级推理和知识基准测试中表现优异，达到前沿性能，可与更大的前沿模型相媲美，并在多项基准测试中显著优于最好的 2.5 模型 Gemini 2.5 Pro。它在 MMMU Pro 上也达到了最先进的性能，令人印象深刻地获得了 81.2% 的分数，可与 Gemini 3 Pro 媲美。一个基准比较表，显示了包括 Gemini 3 Flash、Gemini 3 Pro Thinking、Gemini 2.5 Flash Thinking、Gemini 2.5 Pro Thinking、Claude Sonnet 4.5、GPT-5.2 Extra high 和 Grok 4.1 Fast 在内的多个语言模型的性能分数和价格，涵盖学术推理、科学知识、数学、多模态理解、编码和长上下文性能等任务。除了其前沿级别的推理和多模态能力外，Gemini 3 Flash 还被设计为高度高效，推动质量与成本、速度的帕累托前沿。在处理最高思考级别时，Gemini 3 Flash 能够调节其思考量。对于更复杂的用例，它可能会思考更长时间，但在典型流量下，它平均比 2.5 Pro 少用 30% 的 token，以更高的性能准确完成日常任务。 Gemini 3 Flash 在推动性能与成本、速度的帕累托前沿。这里的性能通过 LMArena (https://lmarena.ai/) Elo 分数来衡量。一个散点图，显示各种语言模型的 LMArena Elo 分数与每百万 token 价格的关系，一条线突出显示了通过 'gemini-3-pro'、'gemini-3-flash' 和 'gemini-3-flash-lite' 的帕累托前沿。 Gemini 3 Flash 的优势在于其原始速度，建立在开发者和消费者已经喜爱的 Flash 系列基础之上。它的性能优于 2.5 Pro，同时速度快 3 倍（基于 Artificial Analysis (https://artificialanalysis.ai/models/gemini-3-flash-reasoning) 基准测试），而成本仅为其一小部分。Gemini 3 Flash 的定价为每 1M 输入 token 0.50 美元，每 1M 输出 token 3 美元（音频输入保持每 1M 输入 token 1 美元）。 ## 面向开发者：跟得上的智能 Gemini 3 Flash 专为迭代开发而设计，提供 Gemini 3 的 Pro 级别编码性能和低延迟——它能够在高频工作流中快速推理和解决任务。在 SWE-bench Verified 上，这是一个评估编码代理能力的基准测试，Gemini 3 Flash 获得了 78% 的分数，不仅优于 2.5 系列，还优于 Gemini 3 Pro。它为代理式编码、生产就绪系统和响应式交互应用实现了理想的平衡。 Gemini 3 Flash 在推理、工具使用和多模态能力方面的强劲表现，非常适合希望进行更复杂视频分析、数据提取和视觉问答的开发者，这意味着它可以支持更智能的应用——如游戏内助手或 A/B 测试实验——这些应用既需要快速响应又需要深度推理。我们已经收到了使用 Gemini 3 Flash 的公司的热烈反响。JetBrains、Bridgewater Associates 和 Figma 等公司已经开始使用它来转变业务，认识到其推理速度、效率和推理能力与更大模型相当。Gemini 3 Flash 今天已通过 Vertex AI 和 Gemini Enterprise 向企业开放。 ## 面向所有人：Gemini 3 Flash 全球推出 Gemini 3 Flash 现已成为 Gemini 应用中的默认模型，取代了 2.5 Flash。这意味着我们全球的 Gemini 用户都可以免费获得 Gemini 3 体验，让他们的日常任务得到重大升级。由于 Gemini 3 Flash 令人难以置信的多模态推理能力，您可以用它来帮助您更快地查看、聆听和理解任何类型的信息。例如，您可以让 Gemini 理解您的视频和图像，并在几秒钟内将该内容转化为有用且可操作的计划。或者，您可以使用语音快速从零构建有趣、有用的应用，无需先前的编码知识。只需在旅途中向 Gemini 口述，它就可以在几分钟内将您的非结构化想法转化为可运行的应用。 Gemini 3 Flash 也开始作为搜索中 AI 模式的默认模型向全球所有人推出。基于 Gemini 3 Pro 的推理能力，搭载 Gemini 3 Flash 的 AI 模式在解析问题细微差别方面更加强大。它考虑查询的每个方面，以提供经过深思熟虑、全面的响应，这些响应在视觉上易于理解——从整个网络提取实时本地信息和有用的链接。结果有效地将研究与即时行动相结合：您获得智能组织的细分以及具体建议——以搜索的速度。这在处理具有多个考量的复杂目标时尤为出色，比如规划最后一刻的旅行或快速学习复杂的教育概念。 ## 立即试用 Gemini 3 Flash Gemini 3 Flash 现已在 Google AI Studio、Google Antigravity (https://antigravity.google/)、Vertex AI (https://cloud.google.com/vertex-ai?e=48754805) 和 Gemini Enterprise (https://cloud.google.com/gemini-enterprise?e=48754805) 的 Gemini API (https://ai.google.dev/gemini-api/docs/models#gemini-3-flash) 中提供预览版。您还可以通过 Gemini CLI (https://developers.googleblog.com/gemini-3-flash-is-now-available-in-gemini-cli/) 和 Android Studio (https://android-developers.googleblog.com/2025/12/build-smarter-apps-with-gemini-3-flash) 等其他开发者工具访问它。它也开始向 Gemini 应用 (https://gemini.google.com/) 和搜索中的 AI 模式 (https://www.google.com/search?udm=50&aep=11) 中的所有人推出，免费带来对下一代智能的快速访问。我们期待看到您用这扩展的模型家族实现什么：Gemini 3 Pro、Gemini 3 Deep Think 以及现在的 Gemini 3 Flash。

Gemini 3 Flash: 为速度而生的前沿智能

相似文章

Gemini 3.5：前沿智能与行动力

Gemini 3.1 Flash-Lite：为大规模智能而生

Gemini 3.5 Flash 凭速度看很不错（8分钟阅读）

Gemini 3.1 Flash-Lite

借助 Gemini 3.5 Flash，谷歌将下一波 AI 押注在智能体而非聊天机器人上

提交意见反馈