OpenAI悄然收购语音克隆初创公司Weights.gg,然后整合了团队(3分钟阅读)

TLDR AI 新闻

摘要

OpenAI悄然收购了语音克隆初创公司Weights.gg,并吸纳了其六人团队,很可能是为了移除未经授权的名人声音的公共目录,同时出于安全考虑限制自己的语音引擎。

OpenAI收购了这支六人团队及其知识产权,然后关闭了Weights.gg,并将其团队成员分散到OpenAI的多个团队中。
查看原文
查看缓存全文

缓存时间: 2026/05/19 00:20

# OpenAI 悄然收购语音克隆初创公司 Weights.gg 来源:https://www.implicator.ai/openai-quietly-bought-voice-cloning-startup-weights-gg-then-folded-the-team/ 工具与工作流(https://www.implicator.ai/tag/vibecoding/) ## OpenAI 悄然收购语音克隆初创公司 Weights.gg,随后团队被拆散 OpenAI 悄然收购了 Weights.gg,这家六人规模的语音克隆初创公司的 Replay 目录中曾托管泰勒·斯威夫特、塞缪尔·杰克逊和特朗普总统等人的声音模型。团队已解散;知识产权已转让。OpenAI 仍表示自己的语音克隆工具风险太大,不宜公开发布。 马库斯·舒勒(https://www.implicator.ai/author/marcus-schuler/) OpenAI 收购 Weights.gg 一事——这家语音克隆初创公司的 Replay 目录曾托管泰勒·斯威夫特、塞缪尔·杰克逊、特朗普总统及其他数十位知名人物的声音模型——与其说是收购雇佣,不如说是一场收网行动。该公司已通过 Voice Engine 拥有语音克隆能力。Voxtral 和 SWivid 的 F5-TTS 等开放权重模型,可在消费级硬件上通过短参考片段克隆声音。据现有证据显示,OpenAI 购买的是移除一个公开的未经授权名人声音目录,此举发生在今年晚些时候预期的公开上市之前。 这笔交易最早由《纽约时报》的迈克·艾萨克于周五报道,他引用了两位知情人士的说法。OpenAI 收购了这支六人团队和知识产权;具体条款未披露。据 PitchBook 数据,Weights.gg 此前已筹集约 400 万美元风险投资,其托管服务于 3 月 31 日关闭,早于公开报道数周。消息人士称,该团队已被分散到 OpenAI 的多个部门,而非集中在一起开发后续产品。他们补充说,OpenAI 不太可能发布类似产品。OpenAI 未回应置评请求。 根据 OpenAI 最新的公开声明,出于安全考虑,Voice Engine 仍仅限于一小部分受信任的合作伙伴使用。该公司自 2024 年 3 月发布 Voice Engine 博客文章以来一直保持这一立场,该文章仍在 openai.com 上可查阅。 关键要点 - OpenAI 今年早些时候悄然收购了语音克隆初创公司 Weights.gg,转移了这支六人团队和知识产权,《纽约时报》周五报道。 - Weights.gg 的 Replay 目录在托管服务于 3 月 31 日关闭前,曾为泰勒·斯威夫特、塞缪尔·杰克逊、特朗普总统等人托管声音模型。 - 即使 Realtime API 在春季持续向开发者推出语音功能,OpenAI 仍以安全为由将 Voice Engine 限制在“有限预览”阶段。 - 据《纽约时报》4 月 24 日报道,OpenAI 目标是在 2026 年底前完成上市。 AI 生成摘要,经编辑审校。更多关于我们的 AI 指南(https://www.implicator.ai/about/)。 ## 能力并非限制因素 2026 年,多家供应商正以消费级价格提供语音克隆服务。据 VentureBeat 报道,xAI 在 5 月从最长 120 秒的参考片段中推出了 Custom Voices。ElevenLabs 自 2023 年起一直是最知名的付费语音克隆提供商之一。3 月 26 日以 CC BY-NC 4.0 许可发布的 Voxtral,以及 SWivid 的 F5-TTS,可在消费级 GPU 上通过 5 到 15 秒的样本克隆声音。 **能力已趋同。限制因素是目录——一家公司控制着哪些内容,以及它已经退出了哪些内容。**据《纽约时报》报道,Weights.gg 的存储库托管了泰勒·斯威夫特、坎耶·韦斯特、塞缪尔·杰克逊、Blackpink 成员、兔八哥、达菲鸭、特朗普总统和前总统乔·拜登 Jr. 的声音模型。据 Variety 报道,斯威夫特于 4 月向美国专利商标局提交了一系列关于她声音和肖像的商标申请。杰克逊曾公开反对使用该技术克隆他的声音。 获取 Implicator.ai 资讯到您的邮箱 来自旧金山的策略性 AI 新闻。没有炒作,没有“AI 将改变一切”的铺垫。只有发生了什么、谁赢了、以及为什么重要。每日太平洋时间早上 6 点发送。 邮箱地址 请检查您的收件箱。点击链接确认。 无垃圾邮件。随时可退订。 400 万美元 Weights.gg 筹集的 venture capital,据 PitchBook 数据 ## Realtime API 将语音界面置于同意契约之内 据 TechCrunch 5 月 7 日报道,OpenAI 推出了 GPT-Realtime-2(语音到语音,该公司称其具有 GPT-5 级别的推理能力)、GPT-Realtime-Translate(支持 70 多种输入语言和 13 种输出语言)以及 GPT-Realtime-Whisper(实时流式转录)。这三项服务均通过 Realtime API 计费。Translate 和 Whisper 按分钟计费;GPT-Realtime-2 按 token 消耗计费。根据 OpenAI 的政策页面,Realtime API 在 OpenAI 的标准使用政策下运行,该政策禁止未经明确同意的冒充行为,并要求开发者向听众披露 AI 生成的声音。 据《纽约时报》报道,Weights.gg 的 Replay 目录没有类似的同意要求。此次收购将该目录从开放网络上移除。OpenAI 从这笔交易中保留的任何知识产权,都可能受限于管理开发者访问的相同 Realtime API 使用政策。 ## 上市前背景 OpenAI 今年已在好莱坞采取多项举措。据《好莱坞报道》报道,该公司于 2 月聘请了 Instagram 前名人合作负责人查尔斯·波奇,负责管理与明星和制片厂的关系。据《华尔街日报》报道,OpenAI 于 3 月 24 日宣布因成本和战略压力关闭 Sora 消费级应用;该应用和网页体验于 4 月 26 日下线,而 Sora API 将持续运行至 9 月 24 日。据《纽约时报》4 月 24 日报道,该公司正准备在 2026 年底前开始作为上市公司交易。 如果按照这一时间表提交 S-1 文件,可能需要披露重大收购和知识产权相关风险,具体取决于 OpenAI 如何定性 Weights.gg 的收购。 ## 关注要点 **美国专利商标局对泰勒·斯威夫特 2026 年 4 月商标申请的行动** 该局是否批准或拒绝登记她的声音和肖像,将影响整个行业如何构建同意契约。 **OpenAI 的 S-1 文件** 预计在年底前提交。它将如何披露(或省略)Weights.gg 的交易条款,将表明 OpenAI 如何定性其获得的知识产权。 **具名的 Realtime API 客户** 尤其是有自定义语音部署的客户,以及随之而来的同意记录。 常见问题解答 **OpenAI 从 Weights.gg 收购了什么?** 两位消息人士告诉《纽约时报》,OpenAI 收购了这支六人工程团队和 Weights.gg 的知识产权。交易条款未披露。据 PitchBook 数据,Weights.gg 此前筹集了约 400 万美元风险投资。消息人士称,该公司不太可能发布类似产品。 **Weights.gg 何时关闭?** Weights.gg 的托管服务于 2026 年 3 月 31 日终止,比《纽约时报》的迈克·艾萨克于 5 月 15 日公开报道 OpenAI 收购一事早了数周。 **Weights.gg 目录中包含了哪些人的声音?** 据《纽约时报》报道,Replay 目录托管了泰勒·斯威夫特、坎耶·韦斯特、塞缪尔·杰克逊、Blackpink 成员、兔八哥、达菲鸭、特朗普总统和前总统乔·拜登 Jr. 的声音模型。斯威夫特于 2026 年 4 月向美国专利商标局提交了关于她声音和肖像的商标申请。杰克逊曾公开反对克隆他的声音。 **OpenAI 对语音克隆的官方立场是什么?** OpenAI 2024 年 3 月的 Voice Engine 博客文章称,该技术风险太大,不宜公开发布。据 TechCrunch 2025 年 3 月报道,该公司将 Voice Engine 限制于一小部分受信任的合作伙伴,用于言语治疗、语言学习、客户支持、视频游戏角色和 AI 化身等领域。 **这与 OpenAI 的 IPO 计划有何关联?** 据《纽约时报》4 月 24 日报道,OpenAI 正准备在 2026 年底前开始作为上市公司交易。如果按照这一时间表提交 S-1 文件,可能需要披露重大收购,包括 Weights.gg 的收购,具体取决于 OpenAI 如何定性这项收购。 AI 生成摘要,经编辑审校。更多关于我们的 AI 指南(https://www.implicator.ai/about/)。 Deepgram 推出 Flux 多语言语音模型,支持 10 种语言通话中切换 Deepgram 今天宣布推出 Flux Multilingual,一种对话式语音识别模型,支持 10 种语言,具备实时语言检测功能,并能在活跃通话中切换语言。 The Implicator(https://www.implicator.ai/deepgram-launches-flux-multilingual-speech-model-with-10-language-mid-call-switching/) DeepL 增加语音翻译,但延迟本身就是产品 DeepL 选择周四推出其酝酿多年的语音功能。新套件可接入 Zoom 和 Microsoft Teams,延伸至移动对话和培训室,并支持联系中心。 The Implicator(https://www.implicator.ai/deepl-adds-voice-translation-but-the-delay-is-the-product/) AI 配音不是翻译。它是权利转移的伪装。 2025 年 12 月,动漫迷打开 Prime Video,听到了一些不对劲的地方。台词以英语和拉丁美洲西班牙语呈现。情节仍然清晰可读。但在包括《香蕉》在内的剧集中,声音…… The Implicator(https://www.implicator.ai/ai-dubbing-is-not-translation-it-is-a-rights-transfer-in-disguise/) 马库斯·舒勒(https://www.implicator.ai/author/marcus-schuler/) 旧金山 Implicator.ai 主编兼创始人。前 ARD 记者和高级广播记者,拥有 10 年以上科技报道经验。撰写关于政策和市场动态的每日简报。现居旧金山。邮箱:[\[email protected\]](https://www.implicator.ai/cdn-cgi/l/email-protection) 早间简报 ### 将早间简报放入您的收件箱。 注册我们的免费每日早间通讯和免费会员文章。仅我们的特别每周专业简报每月收费 8 美元。

相似文章

深入探讨 Voice Engine 的工作原理和我们的安全研究

OpenAI Blog

OpenAI 详细介绍了 Voice Engine 的开发历史和安全方法,从 2022 年的内部测试到包括 ChatGPT 语音模式和 TTS API 在内的各种有限部署,强调了与专业配音演员的谨慎推出和与政策制定者的持续合作,以应对合成语音风险。

应对合成语音的挑战与机遇

OpenAI Blog

OpenAI 讨论了其语音引擎技术面临的挑战和机遇,强调了安全措施、使用政策以及社会需要提高对合成语音风险的抵御能力。该公司目前仅进行小范围预览,尚未广泛发布该技术,同时倡导改进语音认证并提高公众对人工智能能力的认识。

OpenAI 如何实现大规模低延迟语音 AI 部署

OpenAI Blog

OpenAI 详细介绍了其重新架构的 WebRTC 技术栈,旨在为超过 9 亿用户提供大规模低延迟语音 AI 服务。文章阐述了全新的 split-relay 和 transceiver 架构如何优化媒体路由与连接建立,以支持 ChatGPT 语音等实时交互场景。