Gemini Omni

Hacker News Top 2026/05/19 17:46 模型

gemini-omni multimodal ai-model google-deepmind video-editing content-creation safety

摘要

Gemini Omni 是 Google DeepMind 推出的新型 AI 模型，融合了推理与创意能力，支持多模态理解、视频编辑和内容生成，并内置安全措施和数字水印技术。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/05/19 19:14

# Gemini Omni 来源：https://deepmind.google/models/gemini-omni/ Gemini Omni 是 Gemini 推理能力与创造能力的交汇点。它带来了对世界理解、多模态和编辑能力的飞跃。 --- Prompt：让它看起来像我手洞的怪异形状，超级放大并锐化它正在观看的地面，画质更清晰。 Prompt：当手指触碰动物玩具时，播放该动物的叫声。 Prompt：公寓的灯光随着音乐同步亮起。 Prompt：把小提琴手带到图像环境中。 Prompt：让小提琴隐形。 Prompt：将摄像机角度切换至小提琴手的肩膀后方。 Prompt：把飞船换成 —— Prompt：一颗大理石在连锁反应式轨道上快速滚动，连续平滑镜头。 Prompt：关于蛋白质折叠的黏土动画解说，所有东西都用黏土制成，无手，定格动画，准确。 Prompt：关于大脑海马体如何工作的拟物化定格动画解说，配以引人入胜的画外音。不要添加海马。结尾不要有语音中断。不要添加文字。 Prompt：视频展示字母表物品。每个字母对应的不寻常物品放在桌子上（例如C对应水豚，D对应迪斯科球，L对应熔岩灯）。26个字母必须由26个物品表示，并配有对应的下三分之一字幕显示字母。每次只显示一个物品和一个下三分之一字幕。每个下三分之一字幕看起来像用黑色马克笔写在纸条上，位于左下角。快速闪现，大约每帧9个物品，24FPS。最后一帧是张纸条写着“THE END”。整段视频伴随平静流畅的音乐。 Prompt：逐字显示，屏幕每次显示一个词：did, you, know, that, this, model, can, do, pretty, good, text!? 每个词以不同的动画风格出现，节奏完美搭配韵律，精彩剪辑。 --- ### 创建你的提示词使用我们的提示词指南生成逼真、连贯且富有创意的输出。训练/开发评估，包括自动化和人工评估，在模型训练期间和之后持续进行，以监控其进展和表现。人工红队测试：由独立于模型开发团队的专业团队执行，涵盖各项政策和期望，刻意寻找弱点，确保模型遵守安全政策和预期结果。自动化红队测试：动态评估 Gemini Omni Flash 在安全与安保方面的大规模表现，补充人工红队测试和静态评估。模型发布前进行的伦理与安全审查。在 Gemini 应用、Google Flow 或 YouTube 中使用 Omni 创建或编辑的内容，均包含我们不可感知的 SynthID (https://deepmind.google/blog/identifying-ai-generated-images-with-synthid/) 数字水印和 C2PA 内容凭证 (https://contentcredentials.org/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)。你可以通过 Gemini 应用轻松验证内容，Chrome 和搜索功能也将很快支持。欢迎阅读我们的博客文章 (https://blog.google/innovation-and-ai/products/identifying-ai-generated-media-online?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=)，了解更多关于我们如何扩展内容透明度和验证工具，帮助您了解网络内容是如何被创建和编辑的。 --- ### Gemini 激发你的创造力与生产力 ### Google Flow 专为创意人士打造的人工智能创意工作室 ### YouTube Shorts 在 YouTube 上发现、观看和创作的更快捷方式

Gemini Omni

相似文章

什么是 Gemini Omni？

介绍 Gemini Omni：从任意内容生成任意内容

@GoogleDeepMind: 我们正在发布 Gemini Omni：这是我们迈向能够从任何内容创造任何内容的模型的第一步——从视频开始…

Gemini Omni

Google 的 Gemini Omni 将图像、音频和文本转化为视频——而这仅仅是个开始

提交意见反馈