@KevinQHLin:介绍 Violin —— 一款开源视频翻译技能。视频是互联网上的主流媒介,然而大多数高质量内容(讲座、演讲、播客)都局限于单一语言,将全球观众拒之门外。

X AI KOLs Timeline 工具

摘要

Violin 是一款开源视频翻译技能,它将语音识别、LLM 翻译和语音合成整合成一个无缝流水线,支持多语言 ASR、个性化翻译以及与视频内容的交互式聊天。

介绍 Violin —— 一款开源视频翻译技能。视频是互联网上的主流媒介,然而大多数高质量内容(讲座、演讲、播客)都局限于单一语言,将全球观众拒之门外。因此,我们构建了 Violin:一项将语音识别、LLM 翻译和语音合成整合成一条无缝流水线的视频技能。演示:https://violin-ai.com 博客:https://together.ai/blog/violin-open-source-translation-skill… GitHub:https://github.com/shang-zhu/violin… 主要特性:高质量多语言 ASR、翻译与 TTS;个性化翻译与声音(将学术演讲转化为儿童也能跟上的内容);与视频对话——基于视频内容提出任何问题;支持 Web 应用、CLI 和 Agent 技能;完全 MIT 开源。由优秀的 @ShangZhu18 构建,并由 @james_y_zou 提供建议!所有功能由 @togethercompute 提供支持。试试看,告诉我们你的想法!
查看原文
查看缓存全文

缓存时间: 2026/05/15 02:55

介绍Violin——一款开源视频翻译技能。视频是互联网上的主导媒介,但大多数高质量内容(讲座、谈话、播客)局限于单一语言,将全球受众拒之门外。因此,我们构建了Violin:一种视频技能,将语音识别、大语言模型翻译和语音合成整合成一个无缝流程。演示:https://violin-ai.com 博客:https://together.ai/blog/violin-open-source-translation-skill… GitHub:https://github.com/shang-zhu/violin… 主要特性:高质量多语言自动语音识别及翻译及文本转语音。可个性化定制翻译与语音(将学术讲座转化为儿童也能理解的内容)。与视频对话——基于视频内容提出任何问题。支持Web应用、命令行界面和智能体技能。完全开源,采用MIT许可证。由出色的 @ShangZhu18 构建,并在 @james_y_zou 的指导下完成!所有功能由 @togethercompute 提供支持。立即体验并告诉我们你的想法!


Violin — 视频叙述器

来源:https://www.violin-ai.com/ 支持Vimeo、X/Twitter以及1000+个站点(https://github.com/yt-dlp/yt-dlp/blob/master/supportedsites.md)· 最长2小时 · YouTube可能无法在云服务器上使用

仅使用你有权下载的网址——知识共享、公共领域或你自己的内容。

相似文章

@berryxia: 兄弟们,这个可以啊!赶紧装起来! Kevin Lin,牛津大学博士后,前Meta和Microsoft研究员,刚刚把Violin这个开源视频翻译Skill放了出来。 视频已经是互联网绝对主流的内容形式。 可绝大多数高质量讲座、演讲、播客却被…

X AI KOLs Timeline

Violin是一个开源视频翻译工具,集成了语音识别、大语言模型翻译和语音合成功能,支持30多种语言,提供CLI、Web应用和Claude Code三种使用方式。

@rwayne: 视频翻译这事,这下被牛津博士后一个人干通了。 牛津大学博士后 Kevin Lin 开源 Violin 视频翻译工具,把语音识别、LLM 翻译、语音合成整合成自动化流水线。支持多语言互译、个性化翻译风格、视频对话三合一,可以把学术报告转成儿…

X AI KOLs Timeline

牛津大学博士后 Kevin Lin 开源了 Violin 视频翻译工具,将语音识别、LLM 翻译和语音合成整合为自动化流水线,支持多语言互译和个性化风格,并提供 Web、CLI 和 Agent 三种使用方式。

@XAMTO_AI: 这个开源工具要是现在不收藏,将来肯定得后悔——视频自动配音翻译,一口气支持 33 种语言,还能直接对视频内容提问。 在 GitHub 上发现一个宝藏工具,叫 Violin,完全开源,做的事情说出来有点离谱:你把视频丢进去,它自动识别语音、…

X AI KOLs Timeline

Violin 是一个开源的视频自动配音翻译工具,支持33种语言,集成Whisper、DeepSeek等模型,提供一键式语音识别、翻译、配音合成及视频内问答功能。

@yhslgg: 兄弟们,再分享一个开源视频翻译工具——pyVideoTrans,GitHub 17700 星,做视频搬运和本地化的必备! 一句话:一个视频丢进去,自动走完语音识别→字幕翻译→AI配音→视频合成整条流水线,出来就是另一种语言的完整视频。 核…

X AI KOLs Timeline

pyVideoTrans 是一个开源视频翻译工具,支持自动语音识别、字幕翻译、AI 配音和视频合成,集成了多种 ASR、翻译和 TTS 引擎,适合跨语言视频制作和本地化。