开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建
摘要
Google DeepMind 发布 Nano Banana 2 Lite,这是其最快、最具成本效益的图像模型,并将 Gemini Omni Flash 提供给开发者用于视频生成和对话式编辑。
查看缓存全文
缓存时间: 2026/06/30 18:38
# 使用Nano Banana 2 Lite和Gemini Omni Flash开始构建
来源:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/
我们正在让您更轻松地用Nano Banana 2 Lite(我们最快、最具成本效益的Gemini图像模型)和Gemini Omni Flash(用于高质量视频生成和对话式编辑)来实验和扩展您的创意。
anish
Anish Nangia
产品经理,Google DeepMind
抱歉,您的浏览器不支持嵌入式视频,但您可以[下载](https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Keyword_Header_Genmedia_Dark_V2.mp4)并用您喜欢的播放器观看!
今天,我们通过两个重要版本,让您能更快、更轻松地实验、优化和扩展您的创意:
- **推出****Nano Banana 2 Lite**:我们最快、最具成本效益的图像模型,属于Nano Banana系列,专为高吞吐量、速度和扩展而设计。Nano Banana 2 Lite今天已在[Google AI Studio](https://aistudio.google.com/prompts/new_chat?model=gemini-3.1-flash-lite-image)、[Gemini API](https://ai.google.dev/gemini-api/docs/image-generation)和[Gemini Enterprise Agent Platform](https://console.cloud.google.com/agent-platform/studio/multimodal?model=gemini_omni_flash_preview)上可用。它今天也开始在Google消费级产品中推出,包括搜索中的AI Mode、Gemini应用以及许多其他产品。
- **将****Gemini Omni Flash**推向开发者:我们高质量、成本效益高的视频生成和对话式编辑模型,首次在[Google AI Studio](https://aistudio.google.com/prompts/new_chat?model=gemini-omni-flash-preview&utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)、[Gemini API](https://ai.google.dev/gemini-api/docs/omni)和[Gemini Enterprise Agent Platform](https://console.cloud.google.com/agent-platform/studio/multimodal?model=gemini_omni_flash_preview)上可用。Omni Flash也在[Gemini应用](http://gemini.google/)和[Google Flow](http://flow.google/)上可用。
使用生成式媒体进行构建通常涉及创意迭代。借助这两个模型,开发者可以构建全面的端到端多媒体体验,将快速图像生成与视频创建和编辑连接起来。无论您的工作流程需要生成数千张图像还是编辑多轮视频序列,您现在拥有两个新模型,可以更快地构建、无缝迭代,并将您的创意愿景变为现实。
## Nano Banana 2 Lite:我们最快、最具成本效益的Gemini图像模型
观看Nano Banana 2 Lite与Nano Banana 2在使用简单提示时图像生成速度和质量的并排比较。
Nano Banana 2 Lite(gemini-3.1-flash-lite-image)专为快速构思和高速度的开发者管道而设计,其中速度和成本是主要制约因素。对于目前使用我们第一版Nano Banana(gemini-2.5-flash-image)的开发者,我们推荐用此模型替代,现在即可替换,在关键性能维度上立即获得收益。
Nano Banana 2和2 Lite与竞争对手AI图像模型的性能基准测试,评估了生成/编辑质量(Elo分数)、处理延迟和每1K分辨率图像的成本之间的权衡。
一个展示图像生成和编辑与延迟和价格的GIF
### Nano Banana 2 Lite在以下方面表现出色:
- **延迟:** 文本到图像输出仅需4秒。非常适合交互式原型设计和快速视觉草图。
- **成本效益(每1K图像$0.034):** 对于专注于草图、构思、管理运营预算或低带宽使用量的开发者来说,是一个经济高效的选择。
尽管优先考虑速度,Nano Banana 2 Lite仍保持了可靠的提示遵循度、强角色一致性和清晰的图像内文字渲染。
### 了解Nano Banana系列
一张展示Nano Banana 2 Lite、Nano Banana 2和Nano Banana Pro模型对比的表格
- **Nano Banana 2 Lite(Gemini 3.1 Flash Lite Image):** 专为速度而构建。针对超低延迟至关重要的近实时、高吞吐量工作流进行了优化。
- **Nano Banana 2(Gemini 3.1 Flash Image):** 通用型主力。在较低延迟下提供高质量,实现性能和成本的最佳平衡。
- **Nano Banana Pro(Gemini 3 Pro Image):** 针对复杂、专业用例进行了优化。在准确度比速度更重要的任务中,提供最强大的控制和高级推理能力。
- **Nano Banana(Gemini 2.5 Flash Image):** 我们的旧版模型。我们建议升级到Nano Banana 2 Lite,以获得更好的质量、更快的速度和更低的成本。
要查看完整的模型能力列表以及如何集成,请查看开发者[文档](https://ai.google.dev/gemini-api/docs/omni)。
除了在开发者平台发布外,Nano Banana 2 Lite也即将登陆Google消费级产品,包括搜索中的AI Mode、Gemini应用、NotebookLM、Google Photos、Stitch、Google Flow和Google Ads。
## 使用Gemini Omni Flash体验高质量、经济高效的视频编辑和生成
观看某人使用Gemini Omni表演四个数字魔术,比如从手机中拉出一个3D气球字,以及将屏幕中的水倒入玻璃杯中。角落有一个小的“原始”视频,揭示了她在添加Omni生成特效之前实际拍摄魔术的方式。
在Google I/O上,我们介绍了[Gemini Omni Flash](https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/),这是将Gemini的多模态推理与视频生成和编辑相结合的模型。今天,Gemini Omni Flash(gemini-omni-flash-preview)通过Gemini API和Google AI Studio向开发者推出,原生支持从文本、图像和视频输入组合进行高质量视频生成和对话式编辑。该模型定价具有竞争力,为每秒钟视频输出$0.10,与Veo 3.1 Fast相同。
Omni Flash在以下方面表现出色:
- **对话式视频编辑:** 使用自然语言优化和编辑视频。
- **多模态参考:** 结合图像、文本和视频等输入,保持对场景的控制和一致性。
- **现实世界知识:** Omni利用Gemini的知识,如历史、生物学和叙事逻辑,构建引人入胜的视频。
- **文本和动作同步:** 通过简单提示,将文本和图形直接连接到视频动作。
有关全面的基准测试信息,请访问Google DeepMind的[Gemini Omni](https://deepmind.google/models/gemini-omni/)网页。
张视频编辑基准测试图
局限性:
- Omni目前提供10秒的视频生成,更长的时长即将推出。
- 该模型在Gemini API中尚不支持上传音频参考和场景扩展。
- API模式接受最多3秒的视频参考,但目前模型无法正确处理。
- 在改变场景或平移运动时,角色一致性存在一些局限性,但我们正在努力改进。
Gemini Omni从今天起在Google AI Studio和Gemini API中公开预览。要查看完整的模型能力列表和地区特定限制,请查看开发者[文档](https://ai.google.dev/gemini-api/docs/omni)。
## 今天就用这两个模型构建
真正的魔力在于将这些模型链接在一起。使用Nano Banana 2 Lite作为高速图像生成模型,然后将该图像作为参考传递给Gemini Omni Flash,将其动画化为高质量视频。此外,通过使用[Interactions API](https://ai.google.dev/api/interactions-api)处理这些多轮体验,您可以维护会话历史和上下文,以便用户最多堆叠三个连续的编辑。
为了帮助您入门,我们创建了几个可复用的Demo应用,让您体验如何将Nano Banana 2 Lite和Gemini Omni Flash配对到一个工作流中。
[Anywhere](https://aistudio.google.com/apps/bundled/anywhere)是一个Demo应用,旨在展示两个模型的强大能力。自拍或上传照片,应用使用Nano Banana 2 Lite立即将您传送到数十个标志性地标。然后,当点击图像时,Omni Flash用于将生成的图像转换为该位置的动画片段。
[Space Lift](https://aistudio.google.com/apps/bundled/space-lift)是一个由Nano Banana 2 Lite和Gemini Omni驱动的Demo室内设计应用,让您上传照片后立即重新构想任何房间。应用自动生成跨各种设计美学的完整概念。一旦找到您喜欢的风格,点击视频按钮,观看Omni以电影级展示将设计变为现实,让您在实现之前体验新空间的动态效果。
[Omni product studio](https://aistudio.google.com/apps/bundled/omni-product-studio)是一个Demo应用,将Nano Banana 2 Lite创建的静态图像转换为Gemini Omni创建的电影级电商视频。该Demo通过快速交互将多模态输入合并到图像到视频输出中,展示了交互式媒体的构建。
## 以安全和透明为基础构建
基于Google的安全基础设施,Gemini Omni和Nano Banana 2 Lite使用[SynthID](https://deepmind.google/blog/identifying-ai-generated-images-with-synthid/)水印。您可以通过Gemini应用、Chrome中的Gemini或搜索验证AI内容。[了解更多](https://blog.google/innovation-and-ai/products/identifying-ai-generated-media-online)关于我们如何扩展验证工具,帮助您了解内容在网络上是如何创建和编辑的。
## 立即开始您的项目
Nano Banana 2 Lite资源:
- 前往[Google AI Studio](https://aistudio.google.com/prompts/new_chat?model=gemini-3.1-flash-lite-image)在Playground中试用该模型。
- 深入了解我们的[Gemini API文档](https://ai.google.dev/gemini-api/docs/image-generation)。
- 查看我们的Nano Banana[提示指南](https://ai.google.dev/gemini-api/docs/image-generation#prompt-guide),其中包含最佳实践和示例提示。
Gemini Omni Flash资源:
- 前往[Google AI Studio](https://aistudio.google.com/prompts/new_chat?model=gemini-omni-flash-preview&utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)在Playground中试用该模型。
- 深入了解我们的[Gemini API文档](https://ai.google.dev/gemini-api/docs/omni)。
- 查看我们的Gemini Omni Flash[提示指南](https://ai.google.dev/gemini-api/docs/omni#prompt-guide),其中包含最佳实践和示例提示。
相似文章
Nano Banana 2 Lite
Google DeepMind 发布了 Nano Banana 2 Lite(也称为 Gemini 3.1 Flash Lite Image),定位为最快、最便宜的 Gemini 图像模型,专为速度和规模优化。
@GoogleDeepMind: 我们正在发布两项重大更新:Nano Banana 2 Lite:我们最快且最便宜的Gemini图像模型;Gemini Omni Flash:现在…
Google DeepMind宣布了两项重大模型发布:Nano Banana 2 Lite,一款快速且便宜的Gemini图像模型;以及Gemini Omni Flash,现可通过API用于视频生成和编辑。
Nano Banana 2:将 Pro 级能力与闪电般的速度相结合
Google DeepMind 发布 Nano Banana 2,这是一款图像生成模型,融合了 Nano Banana Pro 的先进能力与 Gemini Flash 的速度。该模型具备改进的主体一致性、精准的文字渲染能力,并已集成到 Gemini、Search 等 Google 产品中。
Nano Banana 2 Lite
DeepMind 推出了 Nano Banana 2 Lite,这是一款快速且成本高效的图像生成模型,具有低延迟和高品质,使设计师和开发者能够快速迭代。
@_philschmid: 今日发布:Nano Banana 2 Lite(GA)和 Gemini Omni Flash API(预览版)。Nano Banana 2 Lite(`gemini-3.1-flash-lite…
Google 发布了用于图像生成的 Gemini 3.1 Flash Lite(GA)以及用于多轮对话式视频编辑的 Gemini Omni Flash API 预览版,价格为 $0.10/秒。