标签
一个实验室发布了 ViMax,这是一个开源多智能体系统,能够完全自动化从文本到视频的制作——生成脚本、分镜和带有连贯角色的视频,解决了长格式 AI 视频生成中的一个关键难题。
# 论文页面 - OmniScript:面向长篇幅电影视频的视听脚本生成 来源:[https://huggingface.co/papers/2604.11102](https://huggingface.co/papers/2604.11102) ## 摘要 本文提出了一项新颖的视频到脚本任务,并同步介绍了 OmniScript——一个 80 亿参数的全模态语言模型,该模型通过渐进式流水线技术训练,用于长篇幅叙事理解与时间定位。当前的[多模态大语言模型](https://huggingface.co/papers?