Stability AI 发布新音频模型,可生成6分钟歌曲

TechCrunch AI 模型

摘要

Stability AI 发布 Stability Audio 3.0,这是一系列音频模型,能够生成长达6分钟的专业级音乐,其中包含较小模型的开放权重版本以及许可训练数据。

Stability Audio 3.0 小型模型可在设备上运行,并生成两分钟长的曲目。
查看原文
查看缓存全文

缓存时间: 2026/05/20 17:27

# Stability AI 发布全新音频模型,可创作6分钟歌曲 | TechCrunch 来源:https://techcrunch.com/2026/05/20/stability-ai-release-a-new-audio-model-that-can-create-six-minute-songs/ Stable Diffusion 背后的公司 Stability AI 正在发布一系列名为 Stability Audio 3.0 的新音频模型。该公司声称,其中旗舰模型能够生成超过六分钟的专业级音乐。 该公司以 Stable Audio 3.0 的名称发布了四款新模型:small SFX(4.59亿参数)、small(4.59亿参数)、medium(14亿参数)和 large(27亿参数)。small 系列的两款模型适用于在设备上生成最长两分钟的音效和音乐。 medium 和 large 模型都能创作长达6分20秒的完整音乐作品,并且能够保持音乐结构和旋律基调。这是2024年发布的 Stable Audio 2.0 所能生成时长的两倍多。 Stability AI 将 small SFX、small 和 medium 模型以开放权重形式提供,供任何人使用和修改。2024年,该公司发布了 Stable Audio Open(https://techcrunch.com/2024/06/05/stability-ai-releases-a-sound-generator/),支持生成最长47秒的音乐。新系列模型相比之前的开放版本有了巨大进步。 **图片来源:** Stability AI large 模型仅通过 API 和自托管付费服务提供。此外,年收入超过100万美元的公司需要获得企业许可证。 包括 Google(https://techcrunch.com/2026/03/25/google-launches-lyria-3-pro-music-generation-model/)和 ElevenLabs(https://techcrunch.com/2026/04/02/elevenlabs-releases-a-new-ai-powered-music-generation-app/)在内的许多公司都在发布围绕音乐生成的模型和工具。然而,正如 Suno(https://www.musicbusinessworldwide.com/suno-fights-to-keep-warner-music-settlement-terms-away-from-umg-and-sony/)和 Udio(https://www.musicbusinessworldwide.com/udio-admits-to-scraping-youtube-audio-for-ai-training-in-answer-to-sony-music-lawsuit/)持续的法庭斗争所证明的那样,数据许可以及与唱片公司的合作可能成为这些服务长期生存的关键部分。 去年,Stability AI 与华纳音乐集团(https://stability.ai/news-updates/warner-music-group-and-stability-ai-join-forces-to-build-next-gen-tools)和环球音乐集团(https://stability.ai/news-updates/universal-music-group-and-stability-ai-announce-strategic-alliance)签署了协议,共同开发模型和音乐创作工具。该公司表示,其最新系列的音频模型基于完全授权的数据构建。 这家 AI 初创公司正在为专业音乐人开发一套新产品,但没有透露更多功能细节。前 Universal Audio 和 Fender 的首席数字官 Ethan Kaplan 将加入公司,领导 Stability 的专业音乐产品业务。 许多 AI 公司正通过聘请音乐行业高管来提升自身资历。今年早些时候,Suno 聘请了前 Merlin 首席执行官 Jeremy Sirota(https://www.musicbusinessworldwide.com/suno-hires-ex-merlin-ceo-jeremy-sirota-as-chief-commercial-officer/)担任首席商务官(https://www.musicbusinessworldwide.com/suno-hires-ex-merlin-ceo-jeremy-sirota-as-chief-commercial-officer/)。ElevenLabs 还从独立音乐发行商 Kobalt 聘请了 Derek Cournoyer 担任其音乐业务的战略负责人(https://www.musicbusinessworldwide.com/derek-cournoyer-appointed-head-of-strategy-music-business-affairs-at-elevenlabs/)。 *当您通过我们文章中的链接购买商品时,我们可能会获得少量佣金(https://techcrunch.com/techcrunch-affiliate-monetization-standards/)。这不会影响我们的编辑独立性。* Ivan 在 TechCrunch 负责报道全球消费科技动态。他常驻印度,此前曾在包括《赫芬顿邮报》和 The Next Web 在内的媒体工作。 您可以通过电子邮件 [[email protected]](mailto:[email protected]) 或通过 Signal 加密信息(账号:ivan.42)联系或核实 Ivan 的报道。 查看个人简介(https://techcrunch.com/author/ivan-mehta/)

相似文章

Stable Audio 3.0(3分钟阅读)

TLDR AI

Stability AI发布了Stable Audio 3.0,这是一个开放权重模型系列,可生成最长六分钟的变长音频,支持LoRA微调和音频修复,基于完全许可的数据训练。

stabilityai/stable-audio-3-medium

Hugging Face Models Trending

Stability AI 发布了 Stable Audio 3,这是一个潜在扩散模型系列,用于可变长度音频生成和编辑,其小型和中型模型的权重已在 Hugging Face 上提供。

Stable Audio 3

Hacker News Top

Stable Audio 3 推出了一系列快速潜扩散模型,用于变长音频生成与编辑,并开源了中小型模型权重。