video-understanding

标签

Cards List
#video-understanding

EasyVideoR1:让视频理解的强化学习更简单

Hugging Face Daily Papers · 2026-04-18 缓存

# 论文页面 - EasyVideoR1:让视频理解的强化学习更简单 来源:[https://huggingface.co/papers/2604.16893](https://huggingface.co/papers/2604.16893) ## 摘要 EasyVideoR1 提出了一个高效的视频理解强化学习框架,可提升训练吞吐量,支持多种视频任务,并实现图像-视频联合训练,在多个基准测试上进行全面评估。[可验证奖励强化学习](https://huggingface.co/papers

0 人收藏 0 人点赞
#video-understanding

TwelveLabs 的 Pegasus 1.5

Product Hunt · 2026-04-14

Pegasus 1.5 是 TwelveLabs 推出的一款 AI 模型,旨在将视频内容转换为基于时间的元数据,从而实现自动化的视频理解和索引。

0 人收藏 0 人点赞
#video-understanding

OmniScript:面向长篇幅电影视频的视听脚本生成

Hugging Face Daily Papers · 2026-04-13 缓存

# 论文页面 - OmniScript:面向长篇幅电影视频的视听脚本生成 来源:[https://huggingface.co/papers/2604.11102](https://huggingface.co/papers/2604.11102) ## 摘要 本文提出了一项新颖的视频到脚本任务,并同步介绍了 OmniScript——一个 80 亿参数的全模态语言模型,该模型通过渐进式流水线技术训练,用于长篇幅叙事理解与时间定位。当前的[多模态大语言模型](https://huggingface.co/papers?

0 人收藏 0 人点赞
← Previous
← 返回首页

提交意见反馈