video-understanding

标签

Cards List
#video-understanding

OmniScript:面向长篇幅电影视频的视听脚本生成

Hugging Face Daily Papers · 2026-04-13 缓存

# 论文页面 - OmniScript:面向长篇幅电影视频的视听脚本生成 来源:[https://huggingface.co/papers/2604.11102](https://huggingface.co/papers/2604.11102) ## 摘要 本文提出了一项新颖的视频到脚本任务,并同步介绍了 OmniScript——一个 80 亿参数的全模态语言模型,该模型通过渐进式流水线技术训练,用于长篇幅叙事理解与时间定位。当前的[多模态大语言模型](https://huggingface.co/papers?

0 人收藏 0 人点赞
← Previous
← 返回首页

提交意见反馈