@HuggingPapers: 字节跳动刚刚在Hugging Face上发布了Bernini,通过文本、图像或参考视频生成或编辑视频,媲美最佳…
摘要
字节跳动发布了Bernini,一个开源的视频生成与编辑模型,可在Hugging Face上获取,性能媲美顶级闭源模型。
字节跳动刚刚在Hugging Face上发布了Bernini
通过文本、图像或参考视频生成或编辑视频
媲美目前最好的闭源模型 https://t.co/267360jgvC
查看缓存全文
缓存时间: 2026/06/01 17:31
字节跳动刚刚在 Hugging Face 上发布了 Bernini
根据文本、图像或参考素材生成或编辑视频
与目前最优秀的闭源模型相媲美 https://t.co/267360jgvC
相似文章
ByteDance/Bernini-R
字节跳动开源了 Bernini-R,一种视频扩散渲染器,结合了基于 MLLM 的语义规划器和基于 DiT 的渲染器,用于统一的视频生成和编辑,在视频编辑上达到顶尖性能。
@HuggingPapers: NVIDIA 刚刚在 Hugging Face 上发布了 AnyFlow 首个任意步数视频扩散模型,可生成高质量文本...
NVIDIA 发布了 AnyFlow,这是首个用于文本到视频生成的任意步数视频扩散模型,允许在推理预算(4 到 50 步)之间实现平滑的质量缩放。
@svpino: 视频生成领域的巨大飞跃!看看这些面孔。我们首次拥有了一款工具,能在场景间保持一致的角色面孔。
BACH作为视频生成领域的一项重大突破被引入,实现了前所未有的角色一致性,跨场景时不会出现面部变形或漂移。
@hank_aibtc: https://x.com/victormustar/status/2058492201261244458/video/1… 我操!美团直接把商业闭源Avatar干翻了, 开源免费版LongCat-Video-Avatar-1.5来了! …
美团开源了LongCat-Video-Avatar-1.5模型,支持单张照片和语音生成逼真的说话视频,支持多语言、长视频,性能超越商业闭源方案。
Show HN: Lance – 图像/视频生成与理解统一模型
字节跳动发布Lance,一个3B参数的统一多模态模型,支持图像和视频的生成、理解与编辑,采用多任务方案从头开始训练。