@HuggingPapers: 字节跳动刚刚在Hugging Face上发布了Bernini，通过文本、图像或参考视频生成或编辑视频，媲美最佳…

X AI KOLs Following 2026/06/01 15:37 模型

video-generation text-to-video image-to-video video-editing byte-dance open-source hugging-face

摘要

字节跳动发布了Bernini，一个开源的视频生成与编辑模型，可在Hugging Face上获取，性能媲美顶级闭源模型。

字节跳动刚刚在Hugging Face上发布了Bernini 通过文本、图像或参考视频生成或编辑视频媲美目前最好的闭源模型 https://t.co/267360jgvC

查看原文

查看缓存全文

缓存时间: 2026/06/01 17:31

字节跳动刚刚在 Hugging Face 上发布了 Bernini

根据文本、图像或参考素材生成或编辑视频

与目前最优秀的闭源模型相媲美 https://t.co/267360jgvC

相似文章

Hugging Face Models Trending

字节跳动开源了 Bernini-R，一种视频扩散渲染器，结合了基于 MLLM 的语义规划器和基于 DiT 的渲染器，用于统一的视频生成和编辑，在视频编辑上达到顶尖性能。

X AI KOLs Following

NVIDIA 发布了 AnyFlow，这是首个用于文本到视频生成的任意步数视频扩散模型，允许在推理预算（4 到 50 步）之间实现平滑的质量缩放。

X AI KOLs Following

BACH作为视频生成领域的一项重大突破被引入，实现了前所未有的角色一致性，跨场景时不会出现面部变形或漂移。

X AI KOLs Timeline

美团开源了LongCat-Video-Avatar-1.5模型，支持单张照片和语音生成逼真的说话视频，支持多语言、长视频，性能超越商业闭源方案。

Hacker News Top

字节跳动发布Lance，一个3B参数的统一多模态模型，支持图像和视频的生成、理解与编辑，采用多任务方案从头开始训练。