你好!我制作了一个探索kokoro的工具。
摘要
用户发布了一个开源工具来探索kokoro模型,代码在GitHub上,模型数据在HuggingFace上。
我基于自己的技术栈构建了这个工具,但所有相关代码都采用MIT许可证。探索kokoro非常有趣,我可能会为其他模型开发类似工具。如果你有特别偏好的模型,请告诉我,我会研究一下。我编写的用于实现此功能的kokoro代码在这里:[https://github.com/wlejon/brosoundml](https://github.com/wlejon/brosoundml)。模型(包括我训练的桥接模型)在这里:[https://huggingface.co/datasets/wlejon/brosoundml-data](https://huggingface.co/datasets/wlejon/brosoundml-data)。如果你很喜欢想尝试,但无法完整构建(需要花一些时间),我提供了未经签名的Windows CPU和CUDA版本供你[下载](https://github.com/wlejon/bro/releases/tag/v0.3.1)。你仍然需要克隆[broworkshop](https://github.com/wlejon/broworkshop)来获取kokoro-lab应用,并下载模型。总之,我觉得这个工具很酷。
相似文章
我开发了 Derpy Turtle:Kokoro 训练器,一个用于通过 RVC 训练更好 Kokoro 音色的 GUI
Derpy Turtle 是一款 Windows GUI 工具,旨在通过整合音色搜索、RVC 模型训练和生成后音色转换,将工作流统一起来,从而增强 Kokoro 的语音输出效果。
@HuggingPapers: NVIDIA 刚刚在 Hugging Face 上发布了 Kokoro TTS 模型的优化版本。一款轻量级、8200万参数的语音合成器…
NVIDIA 在 Hugging Face 上发布了 Kokoro TTS 模型的优化 ONNX 版本。这款拥有 8200 万参数的模型轻量、快速,且可用于商业用途。
jaaari/kokoro-82m
Kokoro-82M 是一款高效、高质量的文本转语音模型,在 Replicate 上可用,支持多种语言和声音,推理成本低。
Kuku: 开源
Kuku 是一款开源工具,旨在作为本地第二大脑,管理各种 AI 交互。
@OpenAIDevs:推出 Euphony,一款用于可视化聊天记录与 Codex 会话日志的开源工具。只需粘贴公开 URL 或上…
OpenAI 发布开源工具 Euphony,可将聊天记录与 Codex 会话日志可视化,并支持筛选与编辑。