@Fluyeporlaweb: ElevenLabs每年花费700美元。HeyGen又是700美元。有人刚刚发布了本地配音研究,彻底取代了这两种订阅…
摘要
OmniVoice Studio是一款免费的开源工具,可在本地将MP4视频配音成600种语言。它使用Whisper进行转录,从3秒音频中克隆声音,并利用Demucs分离背景音,从而无需ElevenLabs和HeyGen等付费订阅。
查看缓存全文
缓存时间: 2026/05/24 10:27
ElevenLabs 一年要 700 美元,HeyGen 同样 700 美元。
有人刚发布了本地配音方案,一次性解决两种订阅。
这个方案叫 OmniVoice Studio,可以直接拖入任何 MP4 文件,并在你自己电脑上完成 600 种语言的配音。
无需订阅。语音数据不离开你的设备。没有每月账单。
- 使用 Whisper 自动转写文本
- 仅需 3 秒音频即可克隆任何声音
- 翻译并配音为你选择的语言
- 使用 Demucs 分离背景音乐
- 将配音声音与原始音轨混合
- 支持 600 种语言
- 可在 Mac、NVIDIA、AMD 以及普通 CPU 上运行
- 兼容 Docker
- Claude 作为活跃的仓库贡献者
最重要的是:一切在本地处理。
你的声音,你的视频,你的数据。没有人能看到它们。
3.7k star,548 fork,8 个版本。
这本来不该免费。
相似文章
ElevenLabs Dubbing v2
ElevenLabs 发布了 Dubbing v2,这是一款 AI 配音模型,通过直接基于原始音频进行条件处理,能够在 90 多种语言中保留原始说话者的情感、语调和表演,提供广播级品质的配音,而成本仅为传统方式的一小部分。
@GitTrend0x: 卧槽兄弟们 本地跑语音克隆+电影级视频配音,直接支持646种语言,完全离线、无API密钥、无需联网,ElevenLabs直接被干翻 https://github.com/debpalash/OmniVoice-Studio… 这波开源神器…
OmniVoice Studio is an open-source desktop app that enables local voice cloning and cinematic video dubbing across 646 languages, fully offline with no API keys, positioning itself as a privacy-focused alternative to ElevenLabs.
@HowToAI_: ElevenLabs刚刚失去了护城河 有人开源了一款单一应用,可替代ElevenLabs和WisprFlow,且100%本地运行…
一款名为Voicebox的开源应用替代了ElevenLabs和WisprFlow,支持本地语音克隆、多种TTS引擎和MCP服务器,可在多种硬件上运行,采用MIT许可证。
@noahduck283: 可以下载任何 YouTube 视频、干净地去除人声、进行转录、翻译成 100 多种语言、克隆原声并完成全自动配音的工具。全程不到 2 分钟。100% 本地运行。免费 把六个顶级开源模型缝进了一个网页"一键下载、去人声、转录、翻译、配音"的…
Voice-Pro 是一个整合了六个顶级开源模型(Whisper、Demucs、CosyVoice、F5-TTS 等)的网页工具,支持 YouTube 视频下载、去人声、转录、翻译、语音克隆和全自动配音,全程不到2分钟,100%本地运行且免费。
@Mng64218162: 你可以免费在本地完成。Claude自行编写动画HTML,免费的Edge TTS处理语音,ffmpeg渲染…
一项免费开源的AI技能,可本地生成完整动画并配有旁白的解说视频,使用Claude生成动画代码,Edge TTS生成语音,ffmpeg进行渲染——无需订阅或API密钥。