voice-cloning

标签

Cards List
#voice-cloning

小猪佩奇:备受喜爱的孩之宝系列要求儿童演员将声音授权给人工智能引发担忧

Reddit r/singularity · 2天前 缓存

孩之宝旗下《小猪佩奇》因要求儿童演员将声音授权用于AI而遭强烈反对,青年演员协会经纪人也发出公开信谴责此举。

0 人收藏 0 人点赞
#voice-cloning

@Fluyeporlaweb: 今年6月GitHub上增长最快的10个仓库:1. pewdiepie-archdaemon/odysseus PewDiePie(1.11亿订阅者…

X AI KOLs Timeline · 3天前 缓存

一条推文列出了2025年6月GitHub上增长最快的10个仓库,涵盖AI工作空间、token压缩、智能体提示优化、视频生成、语音克隆、股票分析、研究智能体等。

0 人收藏 0 人点赞
#voice-cloning

@LinearUncle: 推荐一家叫模思的中国公司的开源声音克隆仓库: MOSS-TTS 你朗读一段文字,它克隆你的声音,然后就可以用你的声音朗读任意文本,查看帖子详情看我实战如何使用,效果很好,可以以假乱真。 https://github.com/OpenMOS…

X AI KOLs Timeline · 2026-06-19 缓存

MOSS-TTS是模思公司推出的开源声音克隆模型,用户朗读少量文本即可克隆声音,随后可用克隆的声音生成任意语音,效果逼真。

0 人收藏 0 人点赞
#voice-cloning

@Gorden_Sun: 有道开源Confucius4-TTS 1.3B大小的TTS模型,支持多语言,支持语音克隆,效果不错,速度特别快。 Github:https://github.com/netease-youdao/Confucius4-TTS… 在线使用:…

X AI KOLs Timeline · 2026-06-18 缓存

有道开源了1.3B参数的Confucius4-TTS模型,支持14种语言的零样本语音克隆与跨语言语音合成,速度快且效果优秀。

0 人收藏 0 人点赞
#voice-cloning

@lmsysorg: SGLang-Omni 现已于第0天提供来自 @Open_MOSS 的 MOSS-TTS-Local Transformer v1.5!这是一个开源的 48 kHz 立体声 TTS 模式…

X AI KOLs Timeline · 2026-06-18 缓存

MOSS-TTS-Local Transformer v1.5 是一个开源的 48 kHz 立体声 TTS 模型,具有零样本语音克隆、原生流式传输,并支持31种语言,基于 Qwen3-4B 骨干网构建,通过 SGLang-Omni 提供。

0 人收藏 0 人点赞
#voice-cloning

@MosiAI_Official: MOSS-TTS Local Transformer v1.5 现已推出。克隆任意声音。说任何语言。听到每一个细节。30多种语言,48 kHz …

X AI KOLs Following · 2026-06-18 缓存

MosiAI发布了MOSS-TTS Local Transformer v1.5,这是一款支持语音克隆、30多种语言以及48 kHz高质量输出的文本转语音模型。

0 人收藏 0 人点赞
#voice-cloning

@FakeMaidenMaker: 炸裂!这个开源项目免费文字转无 AI 味人声,还能克隆任何人的嗓音,并且用文字调整音色! GitHub 狂揽 30K star,出自面壁智能 OpenBMB,VoxCPM 之前拿过 GitHub 和 HuggingFace 双榜第一。 做…

X AI KOLs Timeline · 2026-06-17 缓存

VoxCPM2是OpenBMB开源的语音合成模型,采用无分词器的扩散自回归架构,支持30种语言、语音设计和可控语音克隆,仅需一句话即可克隆音色,或用文字创建全新声音,输出48kHz高质量音频,可商用。

0 人收藏 0 人点赞
#voice-cloning

@Gorden_Sun: ZONOS2:开源MoE TTS模型 8B总参数,0.9B激活参数。支持多语言,支持语音克隆,支持中文,中文效果不错。 模型:

X AI KOLs Timeline · 2026-06-13 缓存

Zyphra released ZONOS2, an open-source MoE text-to-speech model trained on over 6 million hours of multilingual speech, supporting voice cloning and high-quality synthesis across many languages.

0 人收藏 0 人点赞
#voice-cloning

@ZyphraAI: 今天我们发布 ZONOS2,我们的下一代实时 TTS 模型,具有高保真语音克隆功能。ZONOS2 是最…

X AI KOLs Following · 2026-06-12 缓存

Zyphra 发布了 ZONOS2,一个开源的实时 TTS 模型,具有高保真语音克隆功能,采用 Apache 2.0 许可,可在基于 AMD 的 Zyphra Cloud 上使用。

0 人收藏 0 人点赞
#voice-cloning

Zyphra/ZONOS2

Hugging Face Models Trending · 2026-06-11 缓存

ZONOS2 是 Zyphra 推出的一款新型文本转语音模型,基于超过600万小时的多语言语音数据训练,采用混合专家架构,实现高质量语音克隆和低延迟。支持30多种语言,并提供高性能推理服务器。

0 人收藏 0 人点赞
#voice-cloning

AI深度伪造与创作者经济欺诈:2026年检测与防护指南

Reddit r/artificial · 2026-06-10 缓存

Sumsub的这篇文章探讨了针对创作者经济的AI驱动深度伪造欺诈日益增长的威胁,并提供了一份关于检测和防护方法的指南,以应对冒充和语音克隆诈骗。

0 人收藏 0 人点赞
#voice-cloning

@Chenzeze777: 发现一个开源的语音合成模型,不说一声实在过意不去。 20 亿参数,200 万小时数据训练,30 种语言+9 种中国方言直接输入文本就合成,连四川话粤语东北话都有。 最离谱的是什么? 你用自然语言描述音色——「年轻女性,温柔甜美」——它就给…

X AI KOLs Timeline · 2026-06-08 缓存

介绍了一个开源的语音合成模型,20亿参数、200万小时训练,支持30种语言和9种中国方言,可用自然语言描述音色,3秒录音即可克隆声音,音质达48kHz,Apache-2.0协议免费商用。

0 人收藏 0 人点赞
#voice-cloning

dots.tts 2B🎙️ 来自RedNote的SOTA文本转语音模型

Reddit r/LocalLLaMA · 2026-06-05

RedNote发布了dots.tts,一个2B参数的开源文本转语音模型,支持零样本语音克隆和48kHz合成。

1 人收藏 1 人点赞
#voice-cloning

@AdinaYakup: dots.tts 来自小红书的新TTS模型 2B参数 - Apache 2.0 完全连续架构(无编解码器令牌)48kHz合成…

X AI KOLs Following · 2026-06-05 缓存

Dots.tts 是来自小红书(RedNote)的新TTS模型,拥有2B参数,遵循Apache 2.0许可,采用完全连续架构(无编解码器令牌),支持48kHz合成和零样本语音克隆。

0 人收藏 0 人点赞
#voice-cloning

@QT9277: 《不是,这AI声音合成已经变态到这种程度了???》 阿台我今天刷GitHub直接懵了。 VoxCPM2,趋势榜第一,星标干到2万+,海外彻底炸了。我本来以为是又一个PPT开源项目,结果仔细看了眼Demo——我耳朵真的分不清哪个是真人了。 …

X AI KOLs Timeline · 2026-06-05 缓存

介绍VoxCPM2,一个完全免费商用、开源的多语言语音合成模型,支持声音设计、克隆及48kHz高质量输出,在GitHub趋势榜第一。

0 人收藏 0 人点赞
#voice-cloning

Microsoft MAI-Voice-2

Product Hunt · 2026-06-04

微软发布了 MAI-Voice-2,这是一款支持 15 种语言语音克隆的表现力丰富的文本转语音系统。

0 人收藏 0 人点赞
#voice-cloning

本地测试了VoxCPM2(开源TTS)。“终极克隆”模式对呼吸和口音的捕捉效果令人惊叹。

Reddit r/ArtificialInteligence · 2026-06-04

对VoxCPM2的技术解析与基准测试,这是一款开源TTS模型,具备“终极克隆模式”以捕捉呼吸与口音。本地测试显示其低VRAM占用和跨语言口音保持能力。

0 人收藏 0 人点赞
#voice-cloning

@yhslgg: 老杨再特么分享一个宝藏开源工具——KrillinAI,GitHub 10000 星,做多语言音视频内容的绝对值得看! 一句话:从视频下载到字幕翻译、AI配音、视频合成,整条链路全包,还能自动生成平台封面,B站、抖音、小红书、YouTube…

X AI KOLs Timeline · 2026-06-03 缓存

KrillinAI 是一款开源工具,整合了视频下载、字幕翻译、AI配音、视频合成全流程,支持上下文感知翻译、语音克隆、自动布局和封面生成,兼容多种AI模型,适合多语言音视频内容创作与分发。

0 人收藏 0 人点赞
#voice-cloning

@stellarprtcol: 每周我都会偶然发现一个新的GitHub仓库。但很少有像这个列表一样让我停下滚动。10个开源…

X AI KOLs Timeline · 2026-06-03 缓存

精心挑选的10个开源项目列表,提供强大的AI和开发者功能,常常取代昂贵的商业软件——包括AI交易代理、多模型聊天界面、视频生成、语音克隆等。

0 人收藏 0 人点赞
#voice-cloning

@MosiAI_Official: MOSS-TTS-v1.5 刚刚以 20.6K 下载量登上 Hugging Face 热门排行榜的 Text-to-Speech 分类第一。一个多语言、可控…

X AI KOLs Timeline · 2026-06-02 缓存

MOSS-TTS-v1.5 是一个多语言可控 TTS 模型,支持语音克隆和长文本生成,以 20.6K 下载量登上 Hugging Face 热门排行榜第一名。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈