开始使用 Gemini 3 构建
摘要
Google 发布了 Gemini 3 Pro,这是一款全新的 AI 模型,旨在编程、智能体工作流和多模态推理方面超越之前的版本。该模型可通过 Gemini API、Google AI Studio 以及全新的 Google Antigravity 开发平台使用。
查看缓存全文
缓存时间: 2026/05/08 09:37
# 开始使用 Gemini 3 构建
来源:https://blog.google/innovation-and-ai/technology/developers-tools/gemini-3-developers/
无论你是经验丰富的开发者,还是 vibe coding 爱好者,Gemini 3 都能帮你将任何创意变为现实。
## 总体摘要
Google 发布了 Gemini 3 Pro,这是他们最智能的模型,在 AI 基准测试和编程任务中均超越了之前的版本。你可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 访问它,也可以尝试 Google Antigravity 平台进行智能体开发。立即开始构建,探索其在多模态理解、视觉推理和 vibe coding 方面的能力。
摘要由 Google AI 生成。生成式 AI 为实验性功能。
## 要点
- "开始使用 Gemini 3 构建"介绍了 Google 最智能的模型,可将任何创意变为现实。
- Gemini 3 Pro 在 AI 基准测试中超越前代版本,并在智能体工作流和编程任务中表现出色。
- 你可以在 Google AI Studio、Vertex AI 以及 Google Antigravity 等开发者工具中使用 Gemini 3 Pro。
- 该模型解锁了"vibe coding"能力,让你在 Google AI Studio 中通过自然语言提示即可创建应用。
- Gemini 3 Pro 在多模态理解、视觉推理和空间推理方面表现卓越,适用于各种应用场景。
摘要由 Google AI 生成。生成式 AI 为实验性功能。
#### 探索其他风格:
用 Gemini 3 构建任何应用
今天我们正式发布 Gemini 3,这是我们最智能的模型,能够帮助你将任何创意变为现实。Gemini 3 Pro 建立在最先进的推理能力基础之上,在各项主要 AI 基准测试中均超越了之前的版本,取得了前所未有的成绩。它在编程方面也超越了 2.5 Pro,精通智能体工作流和复杂的零样本任务。
基准测试表格,对比了 Gemini 3 Pro、Gemini 2.5 Pro、Claude Sonnet 4.5 和 GPT-5.1 的数据。
Gemini 3 Pro 完美适配现有的生产级智能体和编程工作流,同时也能实现以往无法实现的新应用场景。它目前以预览版形式提供,通过 Google AI Studio 和面向企业的 Vertex AI 中的 Gemini API(https://ai.google.dev/gemini-api/docs)即可使用,200k token 以内的提示输入价格为每百万 token 2 美元,输出价格为每百万 token 12 美元(详见定价:https://ai.google.dev/gemini-api/docs/pricing#gemini-3-pro-preview,了解速率限制和完整定价详情)。此外,你还可以在更广泛的生态系统中通过常用的开发者工具使用它,并且在 Google AI Studio(https://aistudio.google.com/prompts/new_chat?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)中有限速地免费使用。
## 智能体编程
开发者们越来越多地借助 AI 来创建软件。Gemini 3 Pro 在 Gemini 2.5 Pro 的势头和所有反馈的基础上,为智能体编程模型的可能性奠定了全新的智能基础。
Gemini 3 Pro 在 Terminal-Bench 2.0 上获得了 54.2% 的分数,该测试评估模型通过终端操作计算机的工具使用能力。
Terminal Bench 评估图表,对比了 Gemini 3 与其他 AI 模型。
你可以在 Google Antigravity(http://antigravity.google/)这一全新的智能体开发平台中感受该模型的强大能力,此外还可以通过 Gemini CLI(https://geminicli.com/)、Android Studio(https://d.android.com/studio)以及 Cursor、GitHub、JetBrains、Manus、Cline 等其他编程产品使用。
## Google Antigravity
为了推进模型与 IDE 的协同工作方式,我们推出了 Google Antigravity(http://antigravity.google/),展示 Gemini 3 所能实现的可能性。这是一个智能体开发平台,让开发者能够在更高的任务导向层面运作,通过管理工作空间中的智能体来工作,同时核心保留了熟悉的 AI IDE 体验。
这是一种更快速的开发方式:你担任架构师,与智能体协作,它们能够在编辑器、终端和浏览器中自主运行。这些智能体规划并执行复杂的软件任务,通过详细的产物向用户汇报工作。这提升了开发的各个方面,从构建功能、UI 迭代、修复 bug 到研究分析和生成报告。访问 Google Antigravity 网站(http://antigravity.google/)即可免费下载公开预览版,现已支持 MacOS、Windows 和 Linux。
### Gemini API
随着 Gemini 3 的发布,我们推出了一款客户端 bash 工具,让模型能够在智能体工作流中提议 shell 命令,用于本地文件系统导航、驱动开发流程和自动化系统操作等任务。我们同时配套提供了托管的服务器端 bash 工具,支持多语言代码生成和安全原型设计。该功能现已在 Gemini API 中向早期合作伙伴开放,即将全面推出。
此外,Gemini 托管工具 Grounding with Google Search(https://ai.google.dev/gemini-api/docs/google-search)和 URL context(https://ai.google.dev/gemini-api/docs/url-context)现在可以与结构化输出结合使用。这对于构建涉及获取和提取数据,然后以特定格式输出供下游智能体任务使用的智能体应用场景尤为强大。
## Vibe coding
Gemini 3 Pro 解锁了"vibe coding"的真正潜力,在这里自然语言就是你唯一需要的语法。通过显著提升复杂指令遵循和深度工具使用能力,该模型能够将一个高层次的创意通过单个提示转化为完整的交互式应用。它承担了多步骤规划和编码细节的重活,提供更丰富的视觉效果和更深的交互性,让你能够专注于创意愿景。
Gemini 3 Pro 在 WebDev Arena 排行榜上以 1487 Elo 的惊人成绩位居榜首。
图表展示了 1487 的 WebDev Arena 排行榜分数
### Google AI Studio
无论是用单个提示构建游戏、从非结构化的语音笔记生成交互式落地页,还是从餐巾纸草图构建完整的应用,开发者都可以借助 Gemini 3 将创意变为现实。借助该模型,我们将单提示生成能力推向了前所未有的高度,意味着你可以通过单个提示从创意直达 AI 驱动的应用,比如这个用 Google AI Studio 构建的复古游戏(https://aistudio.google.com/app/apps/bundled/synthwave_space?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)。
我们将 Google AI Studio 打造为从提示到 AI 原生应用的最快路径。Build mode(https://ai.studio/build?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)让你比以往更快地添加 AI 能力,自动连接正确的模型和 API,而注释(https://x.com/GoogleAIStudio/status/1981375306423554490)等功能则实现了快速直观的迭代。今天就可在 Google AI Studio 中使用 Gemini 3(https://aistudio.google.com/prompts/new_chat?model=gemini-3-pro-preview?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)开始构建。
## 多模态理解
Gemini 3 是全球复杂多模态理解的最佳模型,在 MMMU-Pro 复杂图像推理和 Video MMMU 视频理解方面均创下新高。结合其智能能力和 100 万 token 的上下文窗口,开发者在构建关键多模态应用场景时可以看到显著提升。为了让你对延迟和成本有更多控制,你现在可以在 Gemini API 中更细粒度地配置多模态视觉处理(https://ai.google.dev/gemini-api/docs/gemini-3?thinking=dynamic#media_resolution),根据应用所需的视觉保真度进行调整。
### 视觉推理
Gemini 3 Pro 在文档理解方面处于同类最佳水平,超越了简单的 OCR(光学字符识别),能够智能处理复杂的文档理解和推理。
你可以在 Google AI Studio 的演示应用中看到该模型的视觉理解、推理和编程能力,它将任何创意变为现实(https://aistudio.google.com/app/apps/bundled/bring_any_idea_to_life?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)。
### 空间推理
该模型提升后的空间理解能力也推动了实体推理任务的强劲表现,如指向、轨迹预测和任务进展,为自动驾驶汽车、XR 设备和机器人等领域解锁了新应用场景。
其空间推理还为桌面、移动设备和操作系统屏幕的智能屏幕理解提供支持,为计算机使用智能体带来显著的性能提升。该模型还能根据鼠标移动和屏幕注释理解用户操作意图,解锁了 Visual Computer(https://aistudio.google.com/app/apps/bundled/visual_computer?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)等演示应用中的全新体验。
### 视频推理
Gemini 3 Pro 具备高帧率理解能力,能够捕捉快速动作,确保开发者不会错过快速移动场景中的关键时刻。除了速度之外,长上下文回忆能力还能实现跨数小时连续镜头的叙事整合和特定细节定位。
## 今天就构建未来
Gemini 3 Pro 现已集成到众多开发者产品和工具中,无缝融入你现有的工作流,并解锁全新的编程方式。
- **使用 Gemini API 构建:**你可以立即通过 Google AI Studio 和面向企业的 Vertex AI 将 Gemini 3 Pro 集成到你的应用中。为了支持该模型更深的推理能力,我们在 API 中引入了新的思考层级(https://ai.google.dev/gemini-api/docs/gemini-3?thinking=high#thinking_level)和更细粒度的媒体分辨率(https://ai.google.dev/gemini-api/docs/gemini-3?thinking=high#media_resolution)参数,以及对思考签名(https://ai.google.dev/gemini-api/docs/gemini-3?thinking=high#thought_signatures)的更严格验证。此次更新对于在多轮对话中保留模型的思考过程至关重要。查看开发者指南(https://ai.google.dev/gemini-api/docs/gemini-3)了解技术细节,并参考提示指南(http://ai.google.dev/gemini-api/docs/prompting-strategies#gemini-3)学习如何使用 Gemini 3 Pro 构建。
- **体验模型的智能体能力:**无论你是为 Android 应用添加 AI 原生功能、通过 Gemini CLI(https://geminicli.com/)自动化工作流,还是在 Google Antigravity(http://antigravity.google/)中管理自主智能体集群,Gemini 3 Pro 都能为复杂的智能体架构提供所需的可靠性。
- **用 Gemini 3 Pro 进行 vibe coding:**Google AI Studio(https://aistudio.google.com/prompts/new_chat?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)是你将任何创意变为现实的最快路径。在 Build mode(https://aistudio.google.com/apps?utm_source=the_keyword&utm_medium=blog&utm_campaign=g3-q4-25)中开始,通过单个提示生成完整的应用。如果你需要灵感,点击"I'm feeling lucky",让 Gemini 3 Pro 同时处理创意灵感和代码实现。
软件格局正在发生变化。随着 AI 改变*谁*在构建以及*如何*构建,我们致力于在你所在的地方与你相遇——为你提供突破可能性边界的工具。
这只是 Gemini 3 时代的开始,但我们已经迫不及待想看到你用 Gemini 3 Pro 构建出什么!
相似文章
Gemini 3.1 Pro:专为最复杂任务打造的更智能模型
Google 发布 Gemini 3.1 Pro,这是一款升级后的 AI 模型,推理能力大幅提升,可应对复杂任务,现已面向开发者、企业和消费者推出。
Gemini 3 开启智能新时代
Google 发布了其迄今为止最智能的模型 Gemini 3,具备增强的推理能力和多模态功能。该模型现已集成到 Google 各产品中,面向 Ultra 订阅用户的「深度思考」复杂问题求解模式即将推出。
借助 Gemini 3.5 Flash,谷歌将下一波 AI 押注在智能体而非聊天机器人上
谷歌发布了 Gemini 3.5 Flash,这是一款针对编码和自主智能体优化的新 AI 模型,将重点从聊天机器人转向智能体 AI。它的性能优于之前的模型,并为 Antigravity 2.0 和 Gemini Spark 等新产品提供支持。
Gemini 3.5:前沿智能与行动力
Google 发布 Gemini 3.5,一个全新 AI 模型系列,聚焦智能体工作流与编程,首发 3.5 Flash 以高速提供前沿性能。
Gemini 3.1 Flash-Lite:为大规模智能而生
Google 推出 Gemini 3.1 Flash-Lite,这是一款高速、高性价比的 AI 模型,现可通过 Google AI Studio 和 Vertex API 预览使用,专为高并发开发者工作负载而设计。