@aigclink: 一个开源的端到端视频翻译+视频问答Skill:violin,亮点是不只是直译,而是内容再创作的设想 它把ASR、LLM翻译和TTS整合成了一条无缝管道视频Skill,这三个环节自动衔接,输入视频即得到翻译后的配音视频 翻译风格可调,比如说…
摘要
Violin是一个开源端到端视频翻译+视频问答工具,整合ASR、LLM翻译和TTS,支持风格调整和内容再创作,可针对视频内容问答。
一个开源的端到端视频翻译+视频问答Skill:violin,亮点是不只是直译,而是内容再创作的设想 它把ASR、LLM翻译和TTS整合成了一条无缝管道视频Skill,这三个环节自动衔接,输入视频即得到翻译后的配音视频 翻译风格可调,比如说把学术演讲改写成儿童能听懂的语言不只是翻译,根据受众调整表达难度和风格,相当于内容再创作,这个对于教育场景来说比较实用 支持针对视频内容问答,AI会基于视频上下文回答,相当于一个视频知识助手 支持Web应用、 CLI、Agent Skill三种方式 #视频翻译skill #skill #violin
相似文章
@KevinQHLin:介绍 Violin —— 一款开源视频翻译技能。视频是互联网上的主流媒介,然而大多数高质量内容(讲座、演讲、播客)都局限于单一语言,将全球观众拒之门外。
Violin 是一款开源视频翻译技能,它将语音识别、LLM 翻译和语音合成整合成一个无缝流水线,支持多语言 ASR、个性化翻译以及与视频内容的交互式聊天。
@berryxia: 兄弟们,这个可以啊!赶紧装起来! Kevin Lin,牛津大学博士后,前Meta和Microsoft研究员,刚刚把Violin这个开源视频翻译Skill放了出来。 视频已经是互联网绝对主流的内容形式。 可绝大多数高质量讲座、演讲、播客却被…
Violin是一个开源视频翻译工具,集成了语音识别、大语言模型翻译和语音合成功能,支持30多种语言,提供CLI、Web应用和Claude Code三种使用方式。
@Russell3402: 阿里国际的开源 AI 全自动短视频引擎 Pixelle-Video 你只需要输入主题,就能自动生成完整短视频 从文案到配音,从配图到剪辑,全部 AI 搞定 gitHub:
阿里国际开源了 AI 全自动短视频引擎 Pixelle-Video,用户只需输入主题即可自动生成包含文案、配音、配图及剪辑的完整短视频。
@shachepi: 天下苦沉浸式翻译久矣。 除了昨天的陪读蛙,KISS Translator 也是个顶级平替。 纯粹,完全开源。界面清爽。除了网页翻译,它同样自建接口支持非常全(Claude、Gemini 等各类AI都能接)。不想被商业插件割韭菜,用这种自接…
天下苦沉浸式翻译久矣。 除了昨天的陪读蛙,KISS Translator 也是个顶级平替。 纯粹,完全开源。界面清爽。除了网页翻译,它同样自建接口支持非常全(Claude、Gemini 等各类AI都能接)。不想被商业插件割韭菜,用这种自接 API 的最稳,加载也快,效果还好! 还没找到顺手平替的,再试试这个。 项目地址:https://github点com/fishjar/kiss-translator
@VincentLogic: 这才是真正的 Harness Engineering 实战吧! 把“文章转视频”的全流程拆解得明明白白:文章 -> 口播稿 -> 网页开发 -> 录音 -> 录屏。 不用卷 Sora 了,用代码写网页做视频可控性高多了,而且完全开源。 感…
本文介绍了一套完整的开源文本转视频工作流,涵盖文稿生成、前端开发、配音与录屏环节,强调通过代码实现更高的可控性与内容创作效率。