Nano Banana 2 Lite(6分钟阅读)

TLDR AI 模型

摘要

Google DeepMind 发布 Nano Banana 2 Lite,这是其最快且最具成本效益的图像模型,以及用于视频生成和对话式编辑的 Gemini Omni Flash,现已在 Google AI Studio 和 API 中提供给开发者。

谷歌发布了其最快且最具成本效益的 Gemini 图像模型 Nano Banana 2 Lite,以及用于视频生成和对话式编辑的 Gemini Omni Flash。这些模型可通过 AI Studio、Gemini API 以及谷歌的企业和消费产品使用。
查看原文
查看缓存全文

缓存时间: 2026/07/01 17:19

# 开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建 来源:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/ 我们正在让您更轻松地通过 Nano Banana 2 Lite(我们最快、最具成本效益的 Gemini 图像模型)和 Gemini Omni Flash(用于高质量视频生成和对话式编辑)来试验和扩展您的创意。 anishAnish Nangia 产品经理,Google DeepMind 抱歉,您的浏览器不支持嵌入式视频,但您可以下载 (https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Keyword_Header_Genmedia_Dark_V2.mp4) 并使用您喜欢的视频播放器观看! 今天,我们通过两大重大发布,让您更快、更轻松地试验、完善和扩展您的创意: - **介绍** **Nano Banana 2 Lite:** (https://deepmind.google/models/gemini-image/flash-lite/) 这是我们 Nano Banana 系列中速度最快、成本效益最高的图像模型,专为高吞吐量、高速和规模而构建。Nano Banana 2 Lite 今天已在 Google AI Studio (https://aistudio.google.com/prompts/new_chat?model=gemini-3.1-flash-lite-image)**、**Gemini API (https://ai.google.dev/gemini-api/docs/image-generation) 和 Gemini Enterprise Agent Platform (https://console.cloud.google.com/agent-platform/studio/multimodal?model=gemini_omni_flash_preview)** 中提供。** 它也在今天开始向 Google 消费者端产品推出,包括搜索中的 AI 模式、Gemini 应用以及许多其他产品**。** - **向开发者提供** **Gemini Omni Flash** (http://deepmind.google/models/gemini-omni)**:** 我们用于视频生成和对话式编辑的高质量、成本效益模型,首次在 Google AI Studio (https://aistudio.google.com/prompts/new_chat?model=gemini-omni-flash-preview&utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)**、**Gemini API (https://ai.google.dev/gemini-api/docs/omni) 和 Gemini Enterprise Agent Platform (https://console.cloud.google.com/agent-platform/studio/multimodal?model=gemini_omni_flash_preview) 中提供。Omni Flash 也可以在 Gemini 应用 (http://gemini.google/) 和 Google Flow (http://flow.google/) 中使用。 使用生成式媒体进行构建通常涉及创意迭代。借助这两个模型,开发者可以构建全面的端到端多媒体体验,将快速图像生成与视频创建和编辑无缝连接。无论您的工作流程需要生成数千张图像还是编辑多轮视频序列,您现在都有两个新模型可以更快地构建、无缝迭代,并将您的创意愿景变为现实。 ## Nano Banana 2 Lite:我们最快、最具成本效益的 Gemini 图像模型 观看 Nano Banana 2 Lite 与 Nano Banana 2 在使用简单提示时图像生成速度和质量的并排比较。 Nano Banana 2 Lite (gemini-3.1-flash-lite-image) 专为快速构思和高速开发者管道而设计,其中速度和成本是主要约束。这是我们为目前使用第一版 Nano Banana (gemini-2.5-flash-image) 的开发者推荐的替代方案,您可以立即替换它,在关键性能维度上获得即时收益。 Nano Banana 2 和 2 Lite 与竞争对手 AI 图像模型的性能基准比较,评估生成/编辑质量(Elo 分数)、处理延迟和每 1K 分辨率图像成本之间的权衡。 一个展示图像生成和编辑与延迟和价格对比的 gif 动图 ### Nano Banana 2 Lite 在以下方面表现出色: - **延迟:** 在 4 秒内提供文本到图像的输出。这使其非常适合交互式原型设计和快速视觉草稿。 - **成本效益(每 1K 图像 $0.034):** 对于专注于草稿、构思、管理运营预算或低带宽使用的开发者来说,这是一个经济高效的选择。 尽管优先考虑速度,Nano Banana 2 Lite 仍保留了可靠的提示遵循能力、强大的人物一致性和清晰的图像内文本渲染。 ### 了解 Nano Banana (https://ai.google.dev/gemini-api/docs/image-generation) 系列 一张展示 Nano Banana 2 Lite、Nano Banana 2 和 Nano Banana Pro 模型对比的表格图表 - **Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image):** 专为速度而构建。针对超低延迟至关重要的近实时、高吞吐量工作流进行了优化。 - **Nano Banana 2 (Gemini 3.1 Flash Image):** 通用型主力模型。在较低延迟下提供高质量,实现了性能和成本的最佳平衡。 - **Nano Banana Pro (Gemini 3 Pro Image):** 针对复杂的专业用例进行了优化。它为准确性比速度更重要的任务提供了最强大的控制和高级推理能力。 - **Nano Banana (Gemini 2.5 Flash Image):** 我们的旧版模型。我们建议升级到 Nano Banana 2 Lite,以获得更好的质量、更快的速度和更低的成本。 要查看完整的模型功能列表以及如何集成,请查看开发者文档 (https://ai.google.dev/gemini-api/docs/omni)。 除了在开发者平台发布外,Nano Banana 2 Lite 还将登陆 Google 消费者端产品,包括搜索中的 AI 模式、Gemini 应用、NotebookLM、Google Photos、Stitch、Google Flow 和 Google Ads。 ## 使用 Gemini Omni Flash 体验高质量、经济高效的视频编辑与生成 观看某人使用 Gemini Omni 表演四个数字魔术,例如从手机中拉出一个 3D 气球文字,以及将屏幕中的水倒入玻璃杯。角落还有一个小的"原始"视频,揭示了她在添加 Omni 生成特效之前实际拍摄这些魔术的方式。 在 Google I/O 大会上,我们介绍了 Gemini Omni Flash (https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/)**,** 这个模型将 Gemini 的多模态推理与视频生成和编辑相结合。今天,Gemini Omni Flash (gemini-omni-flash-preview) 通过 Gemini API 和 Google AI Studio 向开发者推出,原生支持从文本、图像和视频输入的组合中进行高质量视频生成和对话式编辑。该模型的价格具有竞争力,为每秒钟视频输出 $0.10,与 Veo 3.1 Fast 相同。 Omni Flash 在以下方面表现出色: - **对话式视频编辑:** 使用自然语言完善和编辑视频。 - **多模态参考:** 结合图像、文本和视频等输入,保持对场景的控制和一致性。 - **现实世界知识:** Omni 利用 Gemini 的知识,例如历史、生物学和叙事逻辑,来构建引人入胜的视频。 - **文本与动作同步:** 通过简单提示,将文本和图形直接连接到视频动作。 有关全面的基准测试信息,请访问 Google DeepMind 的 Gemini Omni (https://deepmind.google/models/gemini-omni/) 网页。 一张关于视频编辑的基准测试图表 局限性: - Omni 目前提供 10 秒视频生成,更长的时长即将推出。 - 该模型在 Gemini API 中目前不支持上传音频参考和场景扩展。 - API 模式接受最长 3 秒的视频参考,但目前模型无法正确处理。 - 在改变场景或平移移动时,人物一致性存在一些局限性,但我们正在努力改进。 Gemini Omni 从今天起在 Google AI Studio 和 Gemini API 中公开预览。要查看完整的模型功能列表和区域特定限制,请查看开发者文档 (https://ai.google.dev/gemini-api/docs/omni)。 ## 立即使用这两个模型进行构建 真正的魔力在于将这些模型串联使用。将 Nano Banana 2 Lite 用作高速图像生成模型,然后将该图像作为参考传递给 Gemini Omni Flash,将其动画化为高质量视频。此外,通过使用交互 API (https://ai.google.dev/api/interactions-api) 实现这些多轮体验,您可以维护会话历史和上下文,使用户能够堆叠最多三个连续编辑。 为了帮助您入门,我们创建了几个可供您重新混音的演示应用,让您体验如何将 Nano Banana 2 Lite 和 Gemini Omni Flash 配对到一个工作流中。 Anywhere (https://aistudio.google.com/apps/bundled/anywhere) 是一个演示应用,旨在展示这两个模型的强大功能。拍摄自拍照或上传照片,该应用会使用 Nano Banana 2 Lite 立即将您传送到数十个标志性地点。然后,当点击某张图像时,Omni Flash 会将生成的图像转换为该位置的动画剪辑。 Space Lift (https://aistudio.google.com/apps/bundled/space-lift) 是一个由 Nano Banana 2 Lite 和 Gemini Omni 驱动的演示室内设计应用,允许您通过上传照片立即重新构想任何房间。该应用会自动生成跨多种设计美学的完整概念。一旦您找到喜欢的外观,点击视频按钮,观看 Omni 以电影级展示将设计变为现实,让您在将其变为现实之前,先体验新空间的动态效果。 Omni product studio (https://aistudio.google.com/apps/bundled/omni-product-studio) 是一个演示应用,可将 Nano Banana 2 Lite 创建的静态图像转换为由 Gemini Omni 创建的电影级电商视频。该演示通过快速交互将多模态输入与图像到视频输出相结合,展示了交互式媒体的构建。 ## 以安全与透明为基石进行构建 Gemini Omni 和 Nano Banana 2 Lite 基于 Google 的安全基础设施构建,使用 SynthID (https://deepmind.google/blog/identifying-ai-generated-images-with-synthid/) 水印技术。您可以通过 Gemini 应用、Chrome 中的 Gemini 或搜索验证 AI 内容。了解更多关于我们如何扩展验证工具以帮助您了解内容在网络上的创建和编辑方式的信息 (https://blog.google/innovation-and-ai/products/identifying-ai-generated-media-online)。 ## 立即开始您的项目 Nano Banana 2 Lite 资源: - 前往 Google AI Studio (https://aistudio.google.com/prompts/new_chat?model=gemini-3.1-flash-lite-image) 在沙盒中体验该模型。 - 深入了解我们的 Gemini API 文档 (https://ai.google.dev/gemini-api/docs/image-generation)。 - 查看我们的 Nano Banana 提示指南 (https://ai.google.dev/gemini-api/docs/image-generation#prompt-guide),其中包含最佳实践和示例提示。 Gemini Omni Flash 资源: - 前往 Google AI Studio (https://aistudio.google.com/prompts/new_chat?model=gemini-omni-flash-preview&utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=) 在沙盒中体验该模型。 - 深入了解我们的 Gemini API 文档 (https://ai.google.dev/gemini-api/docs/omni)。 - 查看我们的 Gemini Omni Flash 提示指南 (https://ai.google.dev/gemini-api/docs/omni#prompt-guide),其中包含最佳实践和示例提示。

相似文章

Nano Banana 2 Lite

Simon Willison's Blog

Google DeepMind 发布了 Nano Banana 2 Lite(也称为 Gemini 3.1 Flash Lite Image),定位为最快、最便宜的 Gemini 图像模型,专为速度和规模优化。

Nano Banana 2 Lite

Hacker News Top

DeepMind 推出了 Nano Banana 2 Lite,这是一款快速且成本高效的图像生成模型,具有低延迟和高品质,使设计师和开发者能够快速迭代。