@aigclink: 一个开源的端到端视频翻译+视频问答Skill:violin,亮点是不只是直译,而是内容再创作的设想 它把ASR、LLM翻译和TTS整合成了一条无缝管道视频Skill,这三个环节自动衔接,输入视频即得到翻译后的配音视频 翻译风格可调,比如说…

X AI KOLs Timeline 工具

摘要

Violin是一个开源端到端视频翻译+视频问答工具,整合ASR、LLM翻译和TTS,支持风格调整和内容再创作,可针对视频内容问答。

一个开源的端到端视频翻译+视频问答Skill:violin,亮点是不只是直译,而是内容再创作的设想 它把ASR、LLM翻译和TTS整合成了一条无缝管道视频Skill,这三个环节自动衔接,输入视频即得到翻译后的配音视频 翻译风格可调,比如说把学术演讲改写成儿童能听懂的语言不只是翻译,根据受众调整表达难度和风格,相当于内容再创作,这个对于教育场景来说比较实用 支持针对视频内容问答,AI会基于视频上下文回答,相当于一个视频知识助手 支持Web应用、 CLI、Agent Skill三种方式 #视频翻译skill #skill #violin
查看原文

相似文章

@berryxia: 兄弟们,这个可以啊!赶紧装起来! Kevin Lin,牛津大学博士后,前Meta和Microsoft研究员,刚刚把Violin这个开源视频翻译Skill放了出来。 视频已经是互联网绝对主流的内容形式。 可绝大多数高质量讲座、演讲、播客却被…

X AI KOLs Timeline

Violin是一个开源视频翻译工具,集成了语音识别、大语言模型翻译和语音合成功能,支持30多种语言,提供CLI、Web应用和Claude Code三种使用方式。

@shachepi: 天下苦沉浸式翻译久矣。 除了昨天的陪读蛙,KISS Translator 也是个顶级平替。 纯粹,完全开源。界面清爽。除了网页翻译,它同样自建接口支持非常全(Claude、Gemini 等各类AI都能接)。不想被商业插件割韭菜,用这种自接…

X AI KOLs Timeline

天下苦沉浸式翻译久矣。 除了昨天的陪读蛙,KISS Translator 也是个顶级平替。 纯粹,完全开源。界面清爽。除了网页翻译,它同样自建接口支持非常全(Claude、Gemini 等各类AI都能接)。不想被商业插件割韭菜,用这种自接 API 的最稳,加载也快,效果还好! 还没找到顺手平替的,再试试这个。 项目地址:https://github点com/fishjar/kiss-translator