@GoogleDeepMind: 我们正在发布 Gemini Omni:这是我们迈向能够从任何内容创造任何内容的模型的第一步——从视频开始…
摘要
Google DeepMind 宣布推出 Gemini Omni,这是一种新型模型,它将 Gemini 的智能与生成式媒体系统相结合,能够从任何输入创建视频,标志着多模态人工智能的重大进步。
查看缓存全文
缓存时间: 2026/05/19 18:50
我们正在推出Gemini Omni:这是迈向能够从任何事物创造任何事物的模型的第一步——从视频开始。
它结合了Gemini的智能与我们的生成式媒体系统——代表在理解世界、多模态和编辑方面的一次飞跃。
Omni将改进的物理理解与Gemini的历史、生物学和文化知识相结合,弥合了从照片级真实感到有意义故事叙述之间的差距。
行为产生后果,环境对事件做出反应,叙事合乎逻辑地演变。
只需定义一次角色,然后将其放入任何场景中,它们将在地点、动作和光照上保持一致。
通过使用输入参考或直接用自然语言描述,应用风格、动作或效果。
你甚至可以通过向Gemini Omni提问来重新构想所拍摄视频中的动作。
即时转变你的世界——改变环境、添加新物体,或创造完全意想不到的东西。
你可以在 @GeminiApp、@FlowbyGoogle 和 @YouTube Shorts 中试用Gemini Omni Flash——Omni系列中的首个模型。
在接下来几周,我们还将通过API推出它。#GoogleIO
相似文章
介绍 Gemini Omni:从任意内容生成任意内容
Google 推出 Gemini Omni,一种新的多模态 AI 模型,能够从任何输入类型处理并生成跨越文本、图像、音频和视频的内容。
Gemini Omni
Gemini Omni 是 Google DeepMind 推出的新型 AI 模型,融合了推理与创意能力,支持多模态理解、视频编辑和内容生成,并内置安全措施和数字水印技术。
Google 的 Gemini Omni 将图像、音频和文本转化为视频——而这仅仅是个开始
Google 发布了 Gemini Omni,这是一个多模态模型系列,能够从图像、音频和文本生成视频,跨输入进行推理以产生一致的高质量输出。首个模型 Gemini Omni Flash 将在 Google I/O 上向 Gemini 应用、YouTube Shorts 和 Flow 推出。
@GoogleDeepMind: 用Gemini Omni创作你的下一个故事。
Google DeepMind 发布了 Gemini Omni,一款用于创作故事的新AI模型。
Gemini Omni
Gemini Omni 是一款新的人工智能产品,可以从任何输入开始创作,首先从视频开始,正如在 Product Hunt 上所展示的。