transcription

标签

Cards List
#transcription

Show HN:FastUbu – 超快视频归档

Hacker News Top · 2026-06-22

FastUbu 是一个工具,它将索引和转录等现代 AI 技术应用于已有 30 年历史的 Ubu 电影档案,旨在通过 Kino API 提供超快速的视频处理。

0 人收藏 0 人点赞
#transcription

Show HN: Trace – 离线Mac会议转录,可在通话中标记

Hacker News Top · 2026-06-13 缓存

Trace是一款Mac应用,能在本地转录会议内容,无需上传音频,用户可在通话中标记重要时刻,并获取清晰的Markdown转录稿。

0 人收藏 0 人点赞
#transcription

@GenhuiP78950: 把自己攒了半年的 AI 工具开源了。 不是什么大项目,就是一些我自己每天在用的脚本。抖音 B 站视频转录、播客转文字、公众号文章处理、行业情报扫描…… 陆陆续续写了 11 个。 之前一直自己用,最近统一整理了一下,加了安装脚本,写了文档,…

X AI KOLs Timeline · 2026-06-13 缓存

开源了一套包含11个AI工具脚本的集合,用于从抖音、B站、微信公众号等多渠道采集内容并转录为文字,方便构建个人知识库。支持Claude Code、Codex等Agent直接安装使用。

0 人收藏 0 人点赞
#transcription

@trq212: 很多人问我如何用Fable编辑自己的发布视频,所以我做了一个视频来说明!简而言之,它写了大量…

X AI KOLs Following · 2026-06-10 缓存

用户解释了他们如何使用Fable(一款AI工具)通过代码和工具调用来编辑自己的发布视频,包括转录、ffmpeg、色彩校正、Figma MCP和Remotion UI,全程无需触碰视频编辑器。

0 人收藏 0 人点赞
#transcription

@QingQ77: 个人每天在用的 AI Skill 集合,帮我把多平台内容自动转文字、管知识库、监测行业情报。 https://github.com/chubbyguan/chubbyskills… 这套开源技能包一共 11 个,都是作者自己日常在用的东西…

X AI KOLs Timeline · 2026-06-10 缓存

一套包含11个AI技能的开源工具包,支持多平台内容自动转录、知识库管理、行业情报监测等,可直接在Claude Code等AI代理中加载使用。

0 人收藏 0 人点赞
#transcription

@CopyRebeldia: 每月向你收费,把你的会议变成摘要的业务今天非常糟糕。微软发布了…

X AI KOLs Timeline · 2026-06-08 缓存

微软发布了VibeVoice开源模型,可一次性处理一整小时的音频,并返回带有说话人识别和时间戳的结构化文本,颠覆了付费转录服务。

0 人收藏 0 人点赞
#transcription

Signal Recorder SR-7

Product Hunt · 2026-06-07

Signal Recorder SR-7 是一款设备端语音记录器,可转录音频并导出 Markdown 文件。

0 人收藏 0 人点赞
#transcription

你真的需要为转录软件付费吗?

Wired · 2026-05-30 缓存

本文评估了AI转录工具Wispr Flow,并将其与免费替代方案(如开源模型Whisper、Canary以及内置功能苹果听写、谷歌语音输入)进行比较,得出结论:对许多用户来说,付费订阅可能并无必要。

0 人收藏 0 人点赞
#transcription

@PrajwalTomar_: 兄弟,我刚刚做了件疯狂的事。客户通话结束才15分钟,他们邮箱里已经收到可运行的原型了。…

X AI KOLs Following · 2026-05-26 缓存

用户分享如何将 Granola(通话转录工具)和 Lovable(构建工具)结合使用,在通话结束15分钟内为客户交付了一个可运行的原型。

0 人收藏 0 人点赞
#transcription

Trace

Product Hunt · 2026-05-25

Trace 是一款简洁的离线会议转录工具,保留上下文语境,现已在 Product Hunt 上推出。

0 人收藏 0 人点赞
#transcription

我试用了亚马逊的Bee可穿戴设备,既感到好奇又有点毛骨悚然

TechCrunch AI · 2026-05-24 缓存

TechCrunch对亚马逊Bee可穿戴设备的评测,这是一款能够记录、转录和总结对话的AI设备。评测者认为它在专业场景下很有用,但表达了对隐私的担忧。

0 人收藏 0 人点赞
#transcription

@noahduck283: 可以下载任何 YouTube 视频、干净地去除人声、进行转录、翻译成 100 多种语言、克隆原声并完成全自动配音的工具。全程不到 2 分钟。100% 本地运行。免费 把六个顶级开源模型缝进了一个网页"一键下载、去人声、转录、翻译、配音"的…

X AI KOLs Timeline · 2026-05-22 缓存

Voice-Pro 是一个整合了六个顶级开源模型(Whisper、Demucs、CosyVoice、F5-TTS 等)的网页工具,支持 YouTube 视频下载、去人声、转录、翻译、语音克隆和全自动配音,全程不到2分钟,100%本地运行且免费。

1 人收藏 0 人点赞
#transcription

Show HN: 仅CPU转录YouTube、TikTok、X、Instagram视频

Hacker News Top · 2026-05-20 缓存

yapsnap 是一个命令行工具,用于将来自各种来源(YouTube、TikTok 等)的视频/音频转录为纯文本,仅使用 CPU,无需 GPU 或云。它利用 sherpa-onnx 和 yt-dlp 实现离线快速转录。

0 人收藏 0 人点赞
#transcription

PrivateScribe.ai - 完全本地化、MIT许可、免费AI转录,内置HIPAA/法律保护机制 - 一周年更新!

Reddit r/LocalLLaMA · 2026-05-19

PrivateScribe.ai 是一个完全本地化、MIT许可的AI转录平台,具有HIPAA保护机制,现已推出捆绑的macOS应用、上手向导、说话人分离和加密功能。

1 人收藏 1 人点赞
#transcription

使用大语言模型自动标注汉语叙事转录文本

arXiv cs.CL · 2026-05-19 缓存

本文评估了使用大语言模型自动标注汉语口语叙事宏观结构的效果,发现最佳模型在降低65%标注时间的同时,达到了接近人类水平的可靠性,但在语义复杂或词汇多样的叙事文本上性能有所下降。

0 人收藏 0 人点赞
#transcription

Cross-Linguistic Transcription and Phonological Representation in the Hu\`it\'onggu\v{a}nx\`i Hu\'ay\'iy\`iy\v{u}

arXiv cs.CL · 2026-05-15 缓存

本文分析了《回通官话译语》这一明代多语词汇集,将其视为一种结构化的跨语言转录系统,该系统使用汉字来代表非汉语语言,揭示了汉语音韵范畴如何被灵活扩展用于语音近似。

0 人收藏 0 人点赞
#transcription

安大略省医生使用的AI转录工具出现‘幻觉’和错误,审计员发现 | CBC News

Reddit r/artificial · 2026-05-13 缓存

安大略省审计长发现,医生使用的AI转录工具产生错误和幻觉,可能危及患者护理,并批评政府测试不足。

0 人收藏 0 人点赞
#transcription

@tom_doerr:完全在本地捕获、转录和总结会议 https://github.com/Zackriya-Solutions/meeting-minutes…

X AI KOLs Timeline · 2026-05-10 缓存

Meetily 是一款以隐私为先、开源的 AI 会议助手,能够完全在用户的基础设施上本地捕获、转录和总结会议。

0 人收藏 0 人点赞
#transcription

Wave

Product Hunt · 2026-04-19

Wave是一款语音转文字工具,提供本地和云端两种处理选项,让用户自由选择隐私与性能的平衡。

0 人收藏 0 人点赞
#transcription

vaibhavs10/incredibly-fast-whisper

Replicate Explore · 2026-05-08 缓存

一个高度优化的OpenAI Whisper Large v3版本,使用Transformers、Optimum和Flash Attention 2,能够在Replicate上在2分钟内转录150分钟的音频。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈