Show HN: OpenBrief – 本地优先的视频下载与摘要工具

Hacker News Top 工具

摘要

OpenBrief 是一款开源桌面应用,让用户下载视频、转录音频、生成有依据的摘要,以及与媒体内容对话,所有操作都在本地计算机上进行。

OpenBrief 基本上是一个 yt-dlp 的图形界面,并在此基础上增加了 AI 功能——粘贴链接,它会下载到本地,转录和语音生成使用本地 AI 在您的机器上运行。摘要和基于转录的对话使用大语言模型(LLM),目前需要您自带 API 密钥。它是开源且免费的。
查看原文
查看缓存全文

缓存时间: 2026/05/26 00:50

tantara/openbrief 源码: https://github.com/tantara/openbrief # OpenBrief 将视频和音频转化为清晰、可听的简报。 导入视频或音频文件,提取文字稿,生成带来源的摘要,并与内容对话——一切都在你的桌面上完成。 许可协议: AGPL v3 基于 Tauri (https://tauri.app) 构建 平台 Stars (https://github.com/tantara/openbrief/stargazers) 观看演示 (https://youtu.be/OnS3EViayRo) · 功能 · 模型支持 · 安装 · 开发 · 路线图 OpenBrief — 开源 YouTube 摘要工具 (https://youtu.be/OnS3EViayRo) OpenBrief 是一个以 Tauri v2 桌面应用为核心的 pnpm/Turborepo 工作空间。它支持导入本地媒体或视频链接、通过捆绑工具下载媒体、转录音频、生成带来源的摘要、与媒体内容对话、整理播放列表以及导出可复用的笔记。 ## 功能 - 📥 导入任何内容 — 粘贴视频链接或导入本地音频/视频文件。 - ✍️ 本地转录 — 提取字幕或在设备上运行语音转文字。 - 📝 带来源的摘要 — 生成博客风格的 Markdown 简报,附带时间戳要点。 - 💬 与媒体对话 — 针对摘要或完整文字稿提问。 - 🔊 听回放 — 通过文字转语音将摘要转化为音频。 - 🔒 开源且私密 — 在你的机器上运行,免费使用。 通过视频链接或本地文件构建可搜索的媒体库,然后提取文字稿并将所有内容保存在一处。 媒体库视图 打开任意条目即可阅读文字稿、生成带来源的摘要,并与媒体内容进行并列对话。 简报与对话视图 ## 模型支持 | 模型类型 | 已支持 | 待办 | | — | — | — | | 语音转文字 | Whisper, Parakeet, Qwen3-ASR | 无 | | 文字转语音 | Supertonic 3, Qwen3-TTS | 无 | | 大型语言模型 | OpenAI GPT, Anthropic Claude, Google Gemini, OpenRouter DeepSeek | 本地 Gemma 4 | | 视频嵌入 | 无 | 帧和片段嵌入用于语义搜索 | ## 仓库结构 text client/ apps/ tauri/ 主 OpenBrief 桌面应用 src/ React 渲染层,功能 UI,领域逻辑,服务,钩子,国际化 src-tauri/ Tauri v2 Rust 边界,命令,辅助 sidecar,打包脚本 scripts/ 辅助 sidecar 和媒体工具准备脚本 nextjs/ Web 应用及下载/YouTube 路由 tanstack-start/ TanStack Start 应用外壳 expo/ React Native 应用外壳 workers/ Worker 入口点 packages/ api/ 共享 API 路由 auth/ 身份验证集成 db/ 数据库 Schema 与访问 ui/ 共享 UI 组件 validators/ 共享验证工具 tooling/ eslint/ 共享 ESLint 配置 github/ GitHub 设置辅助 prettier/ 共享 Prettier 配置 tailwind/ 共享 Tailwind 配置 typescript/ 共享 TypeScript 配置 AGENTS.md 仓库开发指南 DESIGN.md 产品与 UI 方向 ## 环境要求 - Node.js ^22.21.0 - pnpm 11.0.9 - Rust 和 Cargo - 适用于你操作系统的 Tauri v2 平台前置条件 使用 client/package.json 中声明的包管理器。 ## 安装 在工作空间根目录安装依赖: bash cd client pnpm install 如果在全新机器上 pnpm 报告忽略原生构建脚本,请运行 pnpm approve-builds,批准列出的原生/工具包,然后重新运行 pnpm install。 在需要时创建本地环境变量: bash cp .env.example .env ## 本地开发 同时处理 Web 应用和桌面应用时,在 client/ 目录下使用两个终端: bash pnpm dev:next Next.js 应用运行在 http://localhost:3000bash pnpm dev:tauri Tauri 开发命令会构建辅助 sidecar,通过 Vite 在 http://localhost:1420 启动桌面渲染器,编译 Rust 应用,并启动桌面窗口。 ## 桌面应用 运行 Tauri 桌面应用: bash cd client pnpm dev:tauri 前端开发时仅运行渲染器: bash cd client/apps/tauri pnpm dev 构建前端资源: bash cd client/apps/tauri pnpm build 构建或刷新捆绑的辅助/媒体资源: bash cd client/apps/tauri pnpm setup:dev-sidecars pnpm prepare:media-assets 有用的桌面检查: bash cd client/apps/tauri pnpm test:run pnpm typecheck cd src-tauri && cargo check ## Web 与共享工作空间 运行 Next.js 应用: bash cd client pnpm dev:next 通过 Turbo 运行所有工作空间开发任务: bash cd client pnpm dev 常见工作空间检查: bash cd client pnpm typecheck pnpm lint pnpm build 数据库和身份验证工具: bash cd client pnpm db:push pnpm db:studio pnpm auth:generate 对单个应用或包使用 pnpm --filter <workspace> <script>pnpm -F <workspace> <script>。 ## 路线图 - [x] 改进音频文件支持,用于转录、摘要、回放和导出。 - [ ] 支持更多文档和网页源类型,包括 PDF、HTML 页面及其他文档格式。 - [x] 支持 Parakeet ASR。 - [x] 支持 Qwen3-ASR 和 Qwen3-ForcedAligner。 - [x] 支持 Supertonic 3 TTS。 - [ ] 支持本地 LLM,包括 Gemma 4。 - [ ] 添加视频嵌入,用于跨库的帧和片段语义搜索。 - [ ] 添加语音克隆功能,使摘要能以选定的声音朗读。 - [ ] 通过 Web 和移动应用共享摘要。 - [ ] 支持更多产出格式,包括闪卡和其他可复用的学习或发布输出。 ## 致谢 OpenBrief 的构建借鉴了以下项目并从中获得灵感: - yt-dlp (https://github.com/yt-dlp/yt-dlp) 视频下载支持。 - whisper.cpp (https://github.com/ggml-org/whisper.cpp) 和 transcribe-rs (https://github.com/cjpais/transcribe-rs) 本地语音转文字。 - FluidAudio (https://github.com/FluidInference/FluidAudio) 本地苹果平台音频 AI 灵感。 - Qwen3-ASR (https://github.com/QwenLM/Qwen3-ASR) 语音识别模型支持。 - Qwen3-TTS (https://github.com/QwenLM/Qwen3-TTS) 文字转语音模型支持。 - Supertonic (https://github.com/supertone-inc/supertonic/) Supertonic 3 TTS 支持。 - tweakcn (https://tweakcn.com/themes/cmlhfpjhw000004l4f4ax3m7z) shadcn 主题。 - Voicebox (https://github.com/jamiepine/voicebox) 和 Anarlog (https://github.com/fastrepl/anarlog) 产品与实现灵感。 ## 许可协议 OpenBrief 采用 GNU Affero General Public License v3.0 许可。 ## 验证 运行能证明变更的最小检查,然后根据需要扩大范围: bash cd client/apps/tauri && pnpm test:run <模式> cd client/apps/tauri && pnpm typecheck cd client/apps/tauri/src-tauri && cargo check cd client && pnpm --filter @acme/nextjs typecheck git diff --check 对于打包,在宣称发布之前,先在目标平台上运行相关的 Tauri 构建。

相似文章

Show HN: Files.md —— Obsidian 的开源替代品

Hacker News Top

Files.md 是一款免费、开源的 Markdown 笔记应用,运行于浏览器中,文件存储在本地,支持同步功能,并配有 Telegram 聊天机器人,方便随时随地访问。

Show HN: 仅CPU转录YouTube、TikTok、X、Instagram视频

Hacker News Top

yapsnap 是一个命令行工具,用于将来自各种来源(YouTube、TikTok 等)的视频/音频转录为纯文本,仅使用 CPU,无需 GPU 或云。它利用 sherpa-onnx 和 yt-dlp 实现离线快速转录。

@XAMTO_AI: 兄弟们,这玩意你绝对需要但还没发现! OmniGet,一键粘贴链接,YouTube、Twitter、TikTok、Reddit、Udemy全平台媒体随便拉。 本地桌面App,无广告无跟踪 下载丝滑到爆 内容创作者、研究者、离线党必备 再也…

X AI KOLs Timeline

OmniGet is a free, open-source desktop app that downloads media from YouTube, TikTok, Udemy, and over 1,800 other sites without needing a terminal. It combines video, audio, course, and music downloading into one easy-to-use local application.