Nano Banana 2:将 Pro 级能力与闪电般的速度相结合
摘要
Google DeepMind 发布 Nano Banana 2,这是一款图像生成模型,融合了 Nano Banana Pro 的先进能力与 Gemini Flash 的速度。该模型具备改进的主体一致性、精准的文字渲染能力,并已集成到 Gemini、Search 等 Google 产品中。
我们最新的图像生成模型具备先进的世界知识、生产级规格、主体一致性等特性,同时保持了 Flash 级别的速度。
查看缓存全文
缓存时间:
2026/05/08 09:13
# Nano Banana 2:Pro 级能力与闪电般速度的完美结合
来源:https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
我们的最新图像生成模型具备先进的世界知识、生产级规格、主体一致性等特性,同时保持 Flash 级别的速度。
## 总体摘要
Google DeepMind 推出 Nano Banana 2,这是一款将 Nano Banana Pro 的高级功能与 Gemini Flash 的速度相结合的全新图像模型。现在,你可以在 Gemini 应用、Google 搜索等 Google 产品中体验高质量的图像生成,实现更快速的编辑和迭代。此外,Google 持续改进 SynthID 技术,结合 C2PA 内容凭证,以识别 AI 生成的内容。
摘要由 Google AI 生成。生成式 AI 为实验性功能。
## 要点
- "Nano Banana 2" 融合了 Google 图像模型的优势:速度与高级功能兼备。
- Nano Banana 2 将 Gemini Flash 的速度带入图像生成,实现快速编辑。
- 享受增强的创意控制,包括主体一致性和精准的指令遵循能力。
- Nano Banana 2 正在 Gemini、Search、Ads 等 Google 产品中逐步推出。
- Google 正通过 SynthID 和 C2PA 内容凭证改进 AI 图像识别技术。
摘要由 Google AI 生成。生成式 AI 为实验性功能。
## 基础解读
Google 推出了一款名为 Nano Banana 2 的全新 AI 图像模型。它速度超快,融合了其他图像模型的优点。现在你可以更快地生成图像,同时获得更好的质量和更强的控制能力。该模型已在 Gemini 等 Google 应用中上线,甚至可用于广告创作。
摘要由 Google AI 生成。生成式 AI 为实验性功能。
#### 探索其他风格:
Nano Banana 2 文字,周围环绕 AI 生成的图像
您的浏览器不支持音频元素。
收听文章
此内容由 Google AI 生成。生成式 AI 为实验性功能
[[duration]] 分钟
去年 8 月,我们的 Gemini 图像模型 Nano Banana(https://blog.google/products-and-platforms/products/gemini/updated-image-editing-model/)成为 viral 热点(https://blog.google/products-and-platforms/products/gemini/nano-banana-google-trends-2025/),重新定义了图像生成和编辑。随后在 11 月,我们发布了 Nano Banana Pro(https://blog.google/innovation-and-ai/products/nano-banana-pro/),为用户提供高级智能和工作室级别的创意控制。今天,我们将两者的优势带给 Google 的广大用户。
隆重介绍 Nano Banana 2(Gemini 3.1 Flash Image),我们最新的尖端图像模型。现在,你可以在闪电般的速度下,获得 Nano Banana Pro 中备受喜爱的先进世界知识、高品质和推理能力。
## Flash 速度下的智能与视觉质量
Nano Banana 2 将 Gemini Flash 的高速智能带入视觉生成,实现快速编辑和迭代。它让曾经专属的 Pro 功能惠及更广泛的用户,包括:
- **先进的世界知识:**该模型汲取 Gemini 的真实世界知识库,并通过网络搜索的实时信息和图像进行增强,从而更准确地呈现特定主题。这种深度理解还能帮助你创建信息图、将笔记转化为图表,以及生成数据可视化。
- **精准的文字渲染与翻译**:Nano Banana 2 可以为营销样机或贺卡生成准确、清晰的文字。你甚至可以在图像内翻译和本地化文字,让你的创意在全球范围内传播。
高质量的平铺摄影,展示一张关于水循环的 DIY 信息图,放置在干净的浅灰色纹理背景上,配有手绘黑色箭头引导观众了解整个过程
水循环平铺信息图
三格漫画风格的信息图,16:9 比例,对比 Cumulus、Stratus 和 Cirrus 三种云,每种云都以戏剧性天空为背景,配有粗体标签
三联画信息图对比云的类型
16:9 比例的 Clos Lucé 博物馆图像,以明亮色彩的 Synthetic Cubism 风格呈现,不含任何文字
Synthetic Cubism 风格的 Clos Lucé 博物馆
白色背景上的两张图像:第一张,电影感特写,一个由回收材料精心制作的标牌,展示当地鸟类和花卉,文字为 "Native Wildlife: Please Observe from a Distance",背景是柔和模糊的绿色 foliage。第二张,为印度场景本地化的 "Native Wildlife" 标牌版本,所有文字翻译为印地语
本地化 "Native Wildlife" 标牌
*阅读提示词:Water Cycle*1(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-1)*、Cloud Infographic*2(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-2)*、Cubism*3(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-3)*、Wildlife Sign*4(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-4)
## 增强的创意控制
Nano Banana 2 还大幅缩小了速度与视觉保真度之间的差距,提供高质量、照片级真实的图像。以下是我们最新模型提供的内容,以及相较于原版 Nano Banana 的改进:
- **主体一致性:**在单一工作流中保持多达五个角色的形象一致,以及多达 14 个物体的忠实度,让你可以进行故事板创作和叙事构建,而无需改变输入素材的外观。
- **精准的指令遵循:**通过增强的指令遵循能力,模型更严格地遵守你的复杂要求,捕捉你想法中的具体细微差别,让你得到的图像就是你要求的图像。
- **生产级规格**:完全掌控各种纵横比和从 512px 到 4K 的分辨率,制作引人注目的素材,确保你的视觉内容无论是在竖屏社交帖子还是宽屏背景中都能保持清晰锐利。
- **视觉保真度升级:**Nano Banana 2 呈现生动的光照、更丰富的纹理和更锐利的细节,在 Flash 预期的速度下保持高品质美学。
一张有趣欢快的图像,展示 14 个一致的角色和物品在农场场景中一起玩耍
农场中的欢乐角色与物品
16:9 的故事序列,展示三个毛茸茸的角色建造树屋,多格画面中呈现各种表情和角度
毛茸茸的朋友们建造树屋
情绪化、氛围感强烈的俯瞰视角,薄雾笼罩的山谷,郁郁葱葱的绿色山丘,蜿蜒的道路,以及倒映着阴天天空的深蓝灰色水域
青翠山谷的薄雾全景航拍
鲜艳的波普艺术风格图像,一个穿着醒目西装的人物,带有蓝色漩涡图案和粉色圆圈,佩戴心形太阳镜,以纯钴蓝色背景为衬托,呈现不同的纵横比
不同纵横比的高度风格化波普艺术时尚肖像
*阅读提示词:Farm*5(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-5)*、Treehouse*6(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-6)*、Valley*7(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-7)*、Portrait*8(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-8)
## 立即体验 Nano Banana 2
无论你的需求是什么,我们现在为每个工作流提供完美的工具:Nano Banana Pro 用于需要最大事实准确性的高保真任务,或 Nano Banana 2 用于快速生成、精准指令遵循和集成图像搜索 grounding。
Nano Banana 2 今天开始在 Google 产品中推出,包括:
- **Gemini 应用:**Nano Banana 2 将取代 Fast、Thinking 和 Pro 模型中的 Nano Banana Pro。Google AI Pro 和 Ultra 订阅用户可通过三点菜单重新生成图像(https://support.google.com/gemini/answer/14286560),继续访问 Nano Banana Pro 以完成专业任务。
- **Search:**在 AI Mode 和 Lens 中,通过 Google 应用以及移动端和桌面端浏览器使用。查看可用性(https://support.google.com/websearch/answer/16649374),包括 141 个新增国家和地区以及 8 种新增语言。
- **AI Studio + API:**在 AI Studio(https://aistudio.google.com/prompts/new_chat?model=gemini-3.1-flash-image-preview)和 Gemini API(https://ai.google.dev/gemini-api/docs/image-generation)中提供预览版。定价见此(https://ai.google.dev/gemini-api/docs/pricing#gemini-3.1-flash-image-preview)。同时在 Google Antigravity(https://antigravity.google/)中可用。
- **Google Cloud:**通过 Vertex AI(https://cloud.google.com/vertex-ai?e=48754805)中的 Gemini API 提供预览版。
- **Flow:**Nano Banana 2 成为 Flow(https://flow.google/)中的默认图像生成模型,所有 Flow 用户均可零积分使用。
- **Google Ads:**Nano Banana 2 现已上线,在 Google Ads 中创建广告系列时提供智能建议。
Gemini 应用模板功能的用户界面,标题为 "Pick a style for your image"。显示 12 个不同艺术风格的预览图块网格,如 "Monochrome"、"Gothic clay" 和 "Steampunk",上方是一个文本提示框,显示 "Describe your image."
在 Gemini 应用中体验 Nano Banana 2,使用全新的模板功能。
两张石墨铅笔素描的并排对比,展示河豚巢的不同诠释:一张是不太准确的、有纹理的、贝壳 lined 的陨石坑,另一张是更准确的几何科学图解,带有手写注释,绘制在野外笔记本中。
Search 中 AI Mode 的 Nano Banana 2 世界知识。
四格拼贴画,展示一只正在度假的 whimsical 袋鼠:在海上驾驶一艘小蓝船、在巴黎咖啡馆喝浓缩咖啡、穿着白色浴袍躺在床上、在彩色充气城堡中跳跃。
Flow 中 Nano Banana 2 的主体保留功能。
阅读提示词:AI Mode in Search9(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-9)、Flow10(https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/#footnote-10)
## 可靠的内容溯源:标记与验证
随着生成式媒体的发展,我们用于识别和理解它的工具也必须进步。我们不断深化内容溯源方法,将尖端的 SynthID(https://deepmind.google/models/synthid/)技术与可互操作的 C2PA 内容凭证(https://c2pa.org/)相结合,为用户提供更完整、更具上下文的信息,不仅告知是否使用了 AI,还说明如何使用。
我们的溯源工具已经产生积极影响。自 11 月推出以来,Gemini 应用中的 SynthID 验证功能(https://blog.google/innovation-and-ai/products/ai-image-verification-gemini-app/)已在各种语言中使用超过 2000 万次,帮助人们识别 Google AI 生成的图像、视频和音频。我们很快也将在 Gemini 应用中推出 C2PA 验证功能。
## 将更多 Google 资讯收入收件箱。
完成。只需再确认一步。
请查收邮件以确认订阅。
您已订阅我们的新闻通讯。
您也可以通过以下方式订阅
### 相关报道
相似文章
Google DeepMind Blog
Google DeepMind 推出 Nano Banana Pro,这是一款基于 Gemini 3 Pro 打造的全新顶尖图像生成与编辑模型。该模型具备更出色的文本渲染能力、增强的世界知识整合能力以及高保真视觉能力,可在 Google 各产品中体验。
Google DeepMind Blog
Google DeepMind 发布 Gemini 3 Pro Image(也称为 Nano Banana Pro),这是一个高保真图像生成和编辑模型,开发者可通过 Gemini API 和 Google AI Studio 获得高级控制功能。
YouTube AI Channels
OpenAI releases GPT-4o Image 2.0, beating Google’s Nano Banana on price, photorealism, and practical tasks like infographics and YouTube thumbnails.
YouTube AI Channels
GPT Image 2.0 正式发布,其在文本渲染、逻辑推理以及复杂提示词遵循能力方面均优于竞品。本文重点介绍了通过使用“photorealism”(照片级真实感)关键词及 4K API 选项等特定技巧,以实现高质量、逼真效果的方法。
Google DeepMind Blog
Google DeepMind 为 Gemini 应用发布了升级的图像编辑模型,在编辑人物和宠物照片时能保持一致的相似度。这个名为 Nano Banana 的新模型备受好评,支持换装、照片混合和风格迁移等功能,同时保持人物特征的一致性。