OpenAI悄然收购语音克隆初创公司Weights.gg,然后整合了团队(3分钟阅读)
摘要
OpenAI悄然收购了语音克隆初创公司Weights.gg,并吸纳了其六人团队,很可能是为了移除未经授权的名人声音的公共目录,同时出于安全考虑限制自己的语音引擎。
OpenAI收购了这支六人团队及其知识产权,然后关闭了Weights.gg,并将其团队成员分散到OpenAI的多个团队中。
查看缓存全文
缓存时间: 2026/05/19 00:20
# OpenAI 悄然收购语音克隆初创公司 Weights.gg
来源:https://www.implicator.ai/openai-quietly-bought-voice-cloning-startup-weights-gg-then-folded-the-team/
工具与工作流(https://www.implicator.ai/tag/vibecoding/)
## OpenAI 悄然收购语音克隆初创公司 Weights.gg,随后团队被拆散
OpenAI 悄然收购了 Weights.gg,这家六人规模的语音克隆初创公司的 Replay 目录中曾托管泰勒·斯威夫特、塞缪尔·杰克逊和特朗普总统等人的声音模型。团队已解散;知识产权已转让。OpenAI 仍表示自己的语音克隆工具风险太大,不宜公开发布。
马库斯·舒勒(https://www.implicator.ai/author/marcus-schuler/)
OpenAI 收购 Weights.gg 一事——这家语音克隆初创公司的 Replay 目录曾托管泰勒·斯威夫特、塞缪尔·杰克逊、特朗普总统及其他数十位知名人物的声音模型——与其说是收购雇佣,不如说是一场收网行动。该公司已通过 Voice Engine 拥有语音克隆能力。Voxtral 和 SWivid 的 F5-TTS 等开放权重模型,可在消费级硬件上通过短参考片段克隆声音。据现有证据显示,OpenAI 购买的是移除一个公开的未经授权名人声音目录,此举发生在今年晚些时候预期的公开上市之前。
这笔交易最早由《纽约时报》的迈克·艾萨克于周五报道,他引用了两位知情人士的说法。OpenAI 收购了这支六人团队和知识产权;具体条款未披露。据 PitchBook 数据,Weights.gg 此前已筹集约 400 万美元风险投资,其托管服务于 3 月 31 日关闭,早于公开报道数周。消息人士称,该团队已被分散到 OpenAI 的多个部门,而非集中在一起开发后续产品。他们补充说,OpenAI 不太可能发布类似产品。OpenAI 未回应置评请求。
根据 OpenAI 最新的公开声明,出于安全考虑,Voice Engine 仍仅限于一小部分受信任的合作伙伴使用。该公司自 2024 年 3 月发布 Voice Engine 博客文章以来一直保持这一立场,该文章仍在 openai.com 上可查阅。
关键要点
- OpenAI 今年早些时候悄然收购了语音克隆初创公司 Weights.gg,转移了这支六人团队和知识产权,《纽约时报》周五报道。
- Weights.gg 的 Replay 目录在托管服务于 3 月 31 日关闭前,曾为泰勒·斯威夫特、塞缪尔·杰克逊、特朗普总统等人托管声音模型。
- 即使 Realtime API 在春季持续向开发者推出语音功能,OpenAI 仍以安全为由将 Voice Engine 限制在“有限预览”阶段。
- 据《纽约时报》4 月 24 日报道,OpenAI 目标是在 2026 年底前完成上市。
AI 生成摘要,经编辑审校。更多关于我们的 AI 指南(https://www.implicator.ai/about/)。
## 能力并非限制因素
2026 年,多家供应商正以消费级价格提供语音克隆服务。据 VentureBeat 报道,xAI 在 5 月从最长 120 秒的参考片段中推出了 Custom Voices。ElevenLabs 自 2023 年起一直是最知名的付费语音克隆提供商之一。3 月 26 日以 CC BY-NC 4.0 许可发布的 Voxtral,以及 SWivid 的 F5-TTS,可在消费级 GPU 上通过 5 到 15 秒的样本克隆声音。
**能力已趋同。限制因素是目录——一家公司控制着哪些内容,以及它已经退出了哪些内容。**据《纽约时报》报道,Weights.gg 的存储库托管了泰勒·斯威夫特、坎耶·韦斯特、塞缪尔·杰克逊、Blackpink 成员、兔八哥、达菲鸭、特朗普总统和前总统乔·拜登 Jr. 的声音模型。据 Variety 报道,斯威夫特于 4 月向美国专利商标局提交了一系列关于她声音和肖像的商标申请。杰克逊曾公开反对使用该技术克隆他的声音。
获取 Implicator.ai 资讯到您的邮箱
来自旧金山的策略性 AI 新闻。没有炒作,没有“AI 将改变一切”的铺垫。只有发生了什么、谁赢了、以及为什么重要。每日太平洋时间早上 6 点发送。
邮箱地址 请检查您的收件箱。点击链接确认。
无垃圾邮件。随时可退订。
400 万美元
Weights.gg 筹集的 venture capital,据 PitchBook 数据
## Realtime API 将语音界面置于同意契约之内
据 TechCrunch 5 月 7 日报道,OpenAI 推出了 GPT-Realtime-2(语音到语音,该公司称其具有 GPT-5 级别的推理能力)、GPT-Realtime-Translate(支持 70 多种输入语言和 13 种输出语言)以及 GPT-Realtime-Whisper(实时流式转录)。这三项服务均通过 Realtime API 计费。Translate 和 Whisper 按分钟计费;GPT-Realtime-2 按 token 消耗计费。根据 OpenAI 的政策页面,Realtime API 在 OpenAI 的标准使用政策下运行,该政策禁止未经明确同意的冒充行为,并要求开发者向听众披露 AI 生成的声音。
据《纽约时报》报道,Weights.gg 的 Replay 目录没有类似的同意要求。此次收购将该目录从开放网络上移除。OpenAI 从这笔交易中保留的任何知识产权,都可能受限于管理开发者访问的相同 Realtime API 使用政策。
## 上市前背景
OpenAI 今年已在好莱坞采取多项举措。据《好莱坞报道》报道,该公司于 2 月聘请了 Instagram 前名人合作负责人查尔斯·波奇,负责管理与明星和制片厂的关系。据《华尔街日报》报道,OpenAI 于 3 月 24 日宣布因成本和战略压力关闭 Sora 消费级应用;该应用和网页体验于 4 月 26 日下线,而 Sora API 将持续运行至 9 月 24 日。据《纽约时报》4 月 24 日报道,该公司正准备在 2026 年底前开始作为上市公司交易。
如果按照这一时间表提交 S-1 文件,可能需要披露重大收购和知识产权相关风险,具体取决于 OpenAI 如何定性 Weights.gg 的收购。
## 关注要点
**美国专利商标局对泰勒·斯威夫特 2026 年 4 月商标申请的行动**
该局是否批准或拒绝登记她的声音和肖像,将影响整个行业如何构建同意契约。
**OpenAI 的 S-1 文件**
预计在年底前提交。它将如何披露(或省略)Weights.gg 的交易条款,将表明 OpenAI 如何定性其获得的知识产权。
**具名的 Realtime API 客户**
尤其是有自定义语音部署的客户,以及随之而来的同意记录。
常见问题解答
**OpenAI 从 Weights.gg 收购了什么?**
两位消息人士告诉《纽约时报》,OpenAI 收购了这支六人工程团队和 Weights.gg 的知识产权。交易条款未披露。据 PitchBook 数据,Weights.gg 此前筹集了约 400 万美元风险投资。消息人士称,该公司不太可能发布类似产品。
**Weights.gg 何时关闭?**
Weights.gg 的托管服务于 2026 年 3 月 31 日终止,比《纽约时报》的迈克·艾萨克于 5 月 15 日公开报道 OpenAI 收购一事早了数周。
**Weights.gg 目录中包含了哪些人的声音?**
据《纽约时报》报道,Replay 目录托管了泰勒·斯威夫特、坎耶·韦斯特、塞缪尔·杰克逊、Blackpink 成员、兔八哥、达菲鸭、特朗普总统和前总统乔·拜登 Jr. 的声音模型。斯威夫特于 2026 年 4 月向美国专利商标局提交了关于她声音和肖像的商标申请。杰克逊曾公开反对克隆他的声音。
**OpenAI 对语音克隆的官方立场是什么?**
OpenAI 2024 年 3 月的 Voice Engine 博客文章称,该技术风险太大,不宜公开发布。据 TechCrunch 2025 年 3 月报道,该公司将 Voice Engine 限制于一小部分受信任的合作伙伴,用于言语治疗、语言学习、客户支持、视频游戏角色和 AI 化身等领域。
**这与 OpenAI 的 IPO 计划有何关联?**
据《纽约时报》4 月 24 日报道,OpenAI 正准备在 2026 年底前开始作为上市公司交易。如果按照这一时间表提交 S-1 文件,可能需要披露重大收购,包括 Weights.gg 的收购,具体取决于 OpenAI 如何定性这项收购。
AI 生成摘要,经编辑审校。更多关于我们的 AI 指南(https://www.implicator.ai/about/)。
Deepgram 推出 Flux 多语言语音模型,支持 10 种语言通话中切换
Deepgram 今天宣布推出 Flux Multilingual,一种对话式语音识别模型,支持 10 种语言,具备实时语言检测功能,并能在活跃通话中切换语言。
The Implicator(https://www.implicator.ai/deepgram-launches-flux-multilingual-speech-model-with-10-language-mid-call-switching/)
DeepL 增加语音翻译,但延迟本身就是产品
DeepL 选择周四推出其酝酿多年的语音功能。新套件可接入 Zoom 和 Microsoft Teams,延伸至移动对话和培训室,并支持联系中心。
The Implicator(https://www.implicator.ai/deepl-adds-voice-translation-but-the-delay-is-the-product/)
AI 配音不是翻译。它是权利转移的伪装。
2025 年 12 月,动漫迷打开 Prime Video,听到了一些不对劲的地方。台词以英语和拉丁美洲西班牙语呈现。情节仍然清晰可读。但在包括《香蕉》在内的剧集中,声音……
The Implicator(https://www.implicator.ai/ai-dubbing-is-not-translation-it-is-a-rights-transfer-in-disguise/)
马库斯·舒勒(https://www.implicator.ai/author/marcus-schuler/)
旧金山
Implicator.ai 主编兼创始人。前 ARD 记者和高级广播记者,拥有 10 年以上科技报道经验。撰写关于政策和市场动态的每日简报。现居旧金山。邮箱:[\[email protected\]](https://www.implicator.ai/cdn-cgi/l/email-protection)
早间简报
### 将早间简报放入您的收件箱。
注册我们的免费每日早间通讯和免费会员文章。仅我们的特别每周专业简报每月收费 8 美元。
相似文章
深入探讨 Voice Engine 的工作原理和我们的安全研究
OpenAI 详细介绍了 Voice Engine 的开发历史和安全方法,从 2022 年的内部测试到包括 ChatGPT 语音模式和 TTS API 在内的各种有限部署,强调了与专业配音演员的谨慎推出和与政策制定者的持续合作,以应对合成语音风险。
应对合成语音的挑战与机遇
OpenAI 讨论了其语音引擎技术面临的挑战和机遇,强调了安全措施、使用政策以及社会需要提高对合成语音风险的抵御能力。该公司目前仅进行小范围预览,尚未广泛发布该技术,同时倡导改进语音认证并提高公众对人工智能能力的认识。
@HowToAI_: ElevenLabs刚刚失去了护城河 有人开源了一款单一应用,可替代ElevenLabs和WisprFlow,且100%本地运行…
一款名为Voicebox的开源应用替代了ElevenLabs和WisprFlow,支持本地语音克隆、多种TTS引擎和MCP服务器,可在多种硬件上运行,采用MIT许可证。
🤖 ElevenLabs 签署协议,利用AI重现斯坦·李的声音和形象
ElevenLabs 与斯坦·李宇宙签署协议,创建斯坦·李的声音和形象的AI克隆,用于数字客串、有声读物和一个读书俱乐部系列,引发了关于同意和剥削的伦理辩论。
OpenAI 如何实现大规模低延迟语音 AI 部署
OpenAI 详细介绍了其重新架构的 WebRTC 技术栈,旨在为超过 9 亿用户提供大规模低延迟语音 AI 服务。文章阐述了全新的 split-relay 和 transceiver 架构如何优化媒体路由与连接建立,以支持 ChatGPT 语音等实时交互场景。