Show HN:FastUbu – 超快视频归档
摘要
FastUbu 是一个工具,它将索引和转录等现代 AI 技术应用于已有 30 年历史的 Ubu 电影档案,旨在通过 Kino API 提供超快速的视频处理。
Ubu 是一个拥有 30 年历史的奇怪电影档案库,你通常只能在博物馆里看到这些电影。我觉得它是现代类似 Midjourney 性能的完美候选。<p>非常喜欢使用 Cheng Lou 的 pretext 和 masonry 模式。通过我的初创公司 Kino 的 API 进行 AI 索引、转录和视频处理。
相似文章
@0xMulight: 用Codex+HyperFrames+Remotion结合一支约 75秒的中文UFO科普视频。 基于GIT上的公开仓库,讲解这个仓库如何把解密 UAP/UFO 文件整理成可读报。 这次我把它们分工成这样: HyperFrames:负责真正…
作者演示了如何利用Codex、HyperFrames和Remotion工具协作制作一支关于UFO解密文件的中文科普视频。同时介绍了GitHub上的一个Claude Code技能仓库,该仓库可自动化整理和分析公开的UAP/UFO政府解密文档。
OmniVideo-100K:一个通过结构化脚本和证据链进行音视频推理的数据集
OmniVideo-100K介绍了一个自动化的数据引擎,通过实体锚定脚本和线索引导的问答生成来提升音视频推理和时间一致性,在多个基准测试上实现了显著的性能提升。
@googlegemma: AI 视频编辑器无法编辑未索引的内容。了解开发者如何在五年前的笔记本电脑上本地使用 Gemma 4 31B 处理……
一名开发者在五年前的笔记本电脑上使用 Gemma 4 31B 处理并索引了一整年的原始视频,使其完全可搜索,展示了本地优先 AI 工具的潜力。
Show HN: OpenBrief – 本地优先的视频下载与摘要工具
OpenBrief 是一款开源桌面应用,让用户下载视频、转录音频、生成有依据的摘要,以及与媒体内容对话,所有操作都在本地计算机上进行。
LiteFrame: 高效视觉编码器解锁视频大语言模型的帧缩放
LiteFrame提出了一种轻量级视频编码器,采用压缩令牌蒸馏(Compressed Token Distillation)训练,可降低延迟,并使视频大语言模型能够处理8倍以上的帧数以实现长视频理解,在降低计算量的同时提高准确性。