video-processing

标签

Cards List
#video-processing

Video2LoRA: 视觉-语言模型的参数化视频内化

Hugging Face Daily Papers · 2天前 缓存

本文介绍Video2LoRA,一种直接从视频表示预测低秩适配(LoRA)权重的方法,能够在冻结的视觉-语言模型中实现高效的视频处理。它将视觉令牌负载降低最多1500倍,查询TTFT降低6-80倍,同时在视频摘要和字幕生成基准上保持性能。

0 人收藏 0 人点赞
#video-processing

@GitTrend0x: 惊呆了 变脸时代 https://github.com/facefusion/facefusion… 这就是 FaceFusion,28.5k star 行业领先的人脸融合 / Deepfake 平台! 本地高精度人脸交换 + Lip S…

X AI KOLs Timeline · 2026-05-29 缓存

FaceFusion 是一个拥有 28.5k star 的开源人脸融合/Deepfake 平台,支持本地高精度人脸交换、唇形同步,以及图片、视频和批量处理,提供完整的任务管理系统。

0 人收藏 0 人点赞
#video-processing

@omarsar0: 刚刚构建了一个疯狂的新代理技能。它可以完美地从YT视频中提取幻灯片,然后编写笔记、图像、转录…

X AI KOLs Following · 2026-05-26 缓存

构建了一个代理技能,可以从YouTube视频中提取幻灯片,并将笔记、图像、转录和幻灯片写入Obsidian知识库,同时提供一个HTML工件用于导航。

0 人收藏 0 人点赞
#video-processing

Swift Sampling:通过泰勒级数选择时间惊喜

Hugging Face Daily Papers · 2026-05-21 缓存

Swift Sampling 是一种无需训练的视频帧选择算法,利用泰勒展开检测长视频中的高信息量时刻。通过识别实际视觉特征与预测特征轨迹的偏差,该算法在视频问答任务中能以极低计算开销提升准确率。

0 人收藏 0 人点赞
#video-processing

nicolascoutureau/video-utils

Replicate Explore · 4天前 缓存

video-utils 是一个托管在 Replicate 上的视频处理工具,运行次数超过 1800 万,可通过 playground 和 API 使用。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈