Google让你轻松制作自己的深度伪造视频
摘要
谷歌在其Flow工具中推出了新的'虚拟化身'功能,允许用户使用Omni Flash模型创建自己的数字克隆,并将其插入到AI生成的视频中。
谷歌对其AI创作软件Flow进行了全面改革,包括一个新的视频模型和一个名为'虚拟化身'的自拍视频生成工具。
查看缓存全文
缓存时间: 2026/05/19 21:42
# Google 让你轻松制作自己的深度伪造视频
来源:https://www.wired.com/story/google-makes-it-easy-to-make-a-deepfake-of-yourself/
当 Google Labs 的产品管理副总裁 Elias Roman 演示公司工具 Flow(一种让用户生成和混搭 AI 视频与图片的功能)的新“虚拟形象”特性时,一种似曾相识的感觉涌上心头。他之前扫描了自己的形象,制作了一个数字克隆体。现在,他可以利用 Google 的新 Omni Flash 模型,将自己插入任何他想要的 AI 生成视频片段中。
“这面向那些想把自己融入内容、但又不想亲自拍摄的创作者。”Roman 说道。
图片可能包含:文字、CD 播放器和电子产品
图片由 Google 提供
这种特定风格的、以社交媒体为先的自拍深度伪造,让人想起 OpenAI 现已停运的 Sora 应用中的一个标志性功能——不过 Google 称之为虚拟形象,而非客串或角色。这些虚拟形象也可通过 Gemini 应用和 YouTube 使用。Google 在加利福尼亚州山景城举行的年度 I/O 开发者大会上宣布了这一新功能。
Google 去年在其实验性 Labs 部门下推出了 Flow。“Google 之前从未有过面向创意工作的产品线,”Roman 表示,“生产力工具,绝对有;开发者工具,当然有;视频消费,也有。但创意工作没有。”他将此视为 Google 为下一代创作者构建工具的尝试。
与 Google I/O 上围绕 Google 搜索的其他公告类似,Flow 的许多新变化也是公司更大战略的一部分:让 AI 智能体(本质上是自动化软件任务管家)和“氛围编码”——即通过自然语言提示向 AI 构建定制功能——对更广泛的受众来说更加主流。例如,用户可以在生成视频时重复自定义指令,并创建自动工作流,将风格相似的剪辑归入文件夹。
图片可能包含:Neil Etheridge、服装、长袖、袖子、时尚、成人、人物、面部和头部
图片由 Google 提供
Flow 最明显的变化之一是驱动体验的新视频生成模型:Omni Flash,它接替了 Veo。类似于 Google 的 Nano Banana 模型为 AI 图像创建过程带来更多世界背景信息,Omni Flash 模型通过更丰富的细节彻底改造了视频生成。
Flow 用户可以通过 Omni Flash 模型在 AI 视频中生成更一致的角色。Roman 表示,这相比过去版本的 Flow 是一个重大改进,之前版本中生成的连续角色在 successive 视频生成中可能会变形。此外,Flow 用户现在可以在一个 AI 场景之后生成另一个 AI 场景中的关键角色?那就是他们自己。
用户通过进入 Flow 账户设置并扫描手机上的二维码来设置自己的“虚拟形象”。然后,Google 要求用户录下自己大声朗读一串数字的声音,并移动头部以捕捉每个角度。这种自拍捕捉方式会让任何注册过 Sora 应用的人感到熟悉——OpenAI 去年推出了这个以 AI 为先的社交媒体平台,人们可以在上面生成和分享自己的片段。OpenAI 在不到七个月后令人惊讶地关闭了它。
与 Sora 应用不同——用户可以根据他人设置生成其他人的视频——Google 对虚拟形象的初始重点是只允许用户创建自己的 AI 版本,而非其他人。使用 Omni 模型生成的每个视频(包括带有你虚拟形象的视频)都包含 Google 的 SynthID 水印。
“你可以从多个角度捕捉自己的声音和视觉身份,并以相当高的保真度呈现出来。”Roman 说道。他生成了一段带有讽刺意味的视频:自己的 AI 版本在一个垃圾箱大火前取笑 Flow 团队,看起来栩栩如生,声音也像他本人。然后他使用 Flow 请求修改生成内容,比如新的背景和不同颜色的衬衫,Omni Flash 在保持虚拟形象细节的同时调整了片段。
这并不是 Google 首次为创作者推出受控的自拍深度伪造视频工具——上个月,YouTube Shorts 增加了有限选项,让用户制作类似的 AI 虚拟形象并插入该平台的剪辑中。其他硅谷公司也在寻找利用生成式 AI 改变创作者输出内容的方法。例如,去年 Meta 推出了一项 AI 功能,可以无缝地将 Instagram Reels 翻译成不同语言,甚至调整创作者的嘴唇动作以匹配不同的声音。
虽然这些 AI 工具可能简化创作者内容生产流程的某些方面——现在你甚至不需要起床就能生成俏皮的竖屏视频——但生成式 AI 越来越让观众两极分化,他们认为这些视频不真实或不符合自己的价值观。前提是他们确实能认出这些视频是 AI 生成的。
相似文章
我用Gemini的AI虚拟形象工具克隆了自己。结果令人不安地像我。
作者测试了谷歌的Gemini AI虚拟形象工具,该工具通过自拍视频创建一个数字克隆,并将其插入AI生成的视频中。结果令人印象深刻地逼真,却又令人不安。
@GoogleDeepMind: Google Flow Gemini Omni 用我们最新的模型创作更具电影感的故事,该模型带来了批量编辑、改进的角色一致性…
Google 宣布其 AI 创意工作室 Flow 的更新,包括新的 Gemini Omni Flash 模型,用于多模态视频编辑,具有改进的角色一致性;Flow Agent 用于协作规划和批量编辑;以及通过自然语言创建自定义工具。还推出了新的移动应用和音乐生成模型 Lyria 3 Pro。
谷歌全新的任意输入输出AI模型令人惊叹
谷歌发布了Omni,这是一个全新的生成式AI模型系列,可以将任何输入转化为任何输出,率先应用于视频创作;测试结果显示喜忧参半,但相比之前的模型有所改进。
你现在可以用AI混剪他人的YouTube Shorts了
Google宣布了一项由Gemini Omni驱动的新YouTube Shorts混剪功能,允许用户利用AI重新风格化片段或将自己插入他人的视频中。
谷歌宣布跻身AI设计领域竞争者行列
谷歌发布了Pics,一款面向Google Workspace的全新AI驱动设计与图像生成应用,直接与Canva和Anthropic的Claude Design竞争。该应用由Nano Banana 2和Gemini驱动,用户可通过文本提示或直接操作来生成并轻松编辑视觉内容。