NTIRE 2026 视频显著性预测挑战赛:方法与结果
摘要
# 论文页面 - NTIRE 2026 视频显著性预测挑战赛:方法与结果 来源:[https://huggingface.co/papers/2604.14816](https://huggingface.co/papers/2604.14816) 作者:,,,,,,,,,,,,,,,,,,,,, ## 摘要 本文概述了 NTIRE 2026 视频显著性预测挑战赛。挑战赛的目标是为提供的视频序列开发自动显著图预测方法。为此,我们准备了一个包含 2,000 条多样化视频、采用开放许可的全新数据集。通过众包鼠标追踪收集注视点及对应显著图,涵盖超过 5,000 名评估者的观看数据。评估在 800 条测试视频子集上进行,采用广泛认可的质量指标。本次挑战赛吸引了 20 余支队伍提交结果,最终 7 支队伍通过代码审查阶段。所有数据均已公开——https://github.com/msu-video-group/NTIRE26_Saliency_Prediction。
查看缓存全文
缓存时间: 2026/04/21 07:21
NTIRE 2026 视频显著性预测挑战赛:方法与结果
来源:https://huggingface.co/papers/2604.14816
作者:,,,,,,,,,,,,,,,,,,,,,
摘要
本文概述了 NTIRE 2026 视频显著性预测挑战赛。参赛者的目标是为提供的视频序列开发自动化的显著图预测方法。为此挑战赛准备了一个包含 2,000 条多样化视频的新数据集,采用开放许可证。通过众包鼠标追踪收集注视点及对应显著图,包含超过 5,000 名评估者的观看数据。在 800 条测试视频子集上使用通用质量指标进行评估。挑战赛吸引了 20 余支队伍提交,最终 7 支队伍通过代码审核。所有数据已公开:https://github.com/msu-video-group/NTIRE26_Saliency_Prediction。
查看 arXiv 页面 (https://arxiv.org/abs/2604.14816)
查看 PDF (https://arxiv.org/pdf/2604.14816)
项目主页 (https://www.codabench.org/competitions/12842/)
GitHub15 (https://github.com/msu-video-group/NTIRE26_Saliency_Prediction)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.14816)
在您的 agent 中获取本文:
hf papers read 2604.14816
尚未安装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash
引用本文的模型 0
暂无模型链接本文
在模型 README.md 中引用 arxiv.org/abs/2604.14816,即可在此页面显示链接。
引用本文的数据集 0
暂无数据集链接本文
在数据集 README.md 中引用 arxiv.org/abs/2604.14816,即可在此页面显示链接。
引用本文的 Spaces 0
暂无 Space 链接本文
在 Space README.md 中引用 arxiv.org/abs/2604.14816,即可在此页面显示链接。
包含本文的合集 0
暂无合集包含本文
将本文添加到合集 (https://huggingface.co/new-collection),即可在此页面显示链接。
相似文章
封闭-开放工业检测场景的统一:新的大规模基准、挑战与基线
介绍了MMIOC-1M,一个用于工业缺陷检测的大规模多模态基准,并提出了RTVPNet,一种精细的文本-视觉提示网络,实现了最先进的性能。
先想象后预测:用于视频事件预测的交错潜在视觉推理
介绍了Future-L1,一种交错潜在视觉推理框架,通过在潜在空间中保持视觉语义来改进视频事件预测。在FutureBench和TwiFF-Bench基准上取得了最先进的结果。
Sparkle:通过解耦指导实现生动的指令引导视频背景替换
本文介绍了Sparkle,这是一个用于指令引导视频背景替换的新数据集和基准,解决了该领域缺乏高质量训练数据的问题。它提出了一种具有解耦指导的可扩展流水线,以生成逼真的前景-背景交互。
Relit-LiVE:通过联合学习环境视频实现视频重光照
本文介绍了 Relit-LiVE,这是一种新颖的视频重光照框架。它利用原始参考图像和联合环境视频预测,在无需相机姿态信息的情况下生成物理一致的结果。
超大视频推理套件
本文介绍了超大视频推理(VBVR)数据集和基准,这是一个大规模资源,包含超过一百万个视频片段,涵盖200个推理任务,能够系统研究时空推理,并展示了早期出现的涌现泛化迹象。