首页
/
产品
/
全新自我表达方式:Gemini现已支持音乐创作
全新自我表达方式:Gemini现已支持音乐创作
摘要
Google DeepMind将新一代生成式音乐模型Lyria 3集成至Gemini应用,用户可通过文本或图像提示创作包含歌词与器乐的自定义曲目。
Gemini应用现已搭载我们最先进的音乐生成模型Lyria 3,让每个人都能通过文本或图像创作30秒音乐片段。
查看缓存全文
缓存时间:
2026/05/08 09:17
# 全新自我表达方式:Gemini 现已支持音乐创作
来源:https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/
自 Gemini 应用推出以来,我们已构建多种工具,鼓励用户通过图像和视频进行创意表达。今天,我们更进一步:推出[自定义音乐生成](https://gemini.google/overview/music-generation/?utm_source=gemini&utm_medium=web&utm_campaign=lyria_marketing_keyword)功能。[Lyria 3](https://deepmind.google/models/lyria/) —— Google DeepMind 最新的生成式音乐模型,今日起在 Gemini 应用中开启 Beta 测试。只需描述一个创意或上传一张照片,例如"一首关于袜子找到另一半的搞笑 R&B 慢歌",短短几秒钟内,Gemini 就能将其转化为高质量、朗朗上口的曲目。若想进一步突破创意边界,你还可以让 Gemini 从你上传的内容中汲取灵感。
Lyria 3 在音频生成方面相比前代 Lyria 模型有三项重要提升:
1. 无需自己提供歌词!系统会根据你的提示词自动生成。
2. 你对风格、人声、节奏等元素的创作控制力更强。
3. 可以创作出更真实、音乐性更复杂的曲目。
以下是使用方法:
- **文本生成曲目:** 描述特定流派、情绪、内部玩笑或回忆,创作带有歌词或纯器乐的独特曲目,贴合你的氛围。*"我感到怀旧。为我的母亲创作一首曲目,关于我们小时候的美好时光,以及她在家煮大蕉的记忆。做成一首有趣的 afrobeat 风格曲目,带有真正的非洲氛围。"*
- **照片和视频生成曲目:** 上传照片或视频,观看 Gemini 利用内容创作完美契合情绪的曲目,并配有相应歌词。*"用这些照片创作一首关于我的狗狗 Duncan 在森林徒步的曲目。"*
Gemini 应用可生成 30 秒的曲目,并由 Nano Banana 生成自定义封面艺术。通过下载或点击分享链接,你可以轻松快速地与朋友分享。这些曲目的目标并非创作音乐杰作,而是为你提供一种有趣、独特的自我表达方式。
您的浏览器不支持音频元素。
创作者还可以在 YouTube 的 [Dream Track](https://support.google.com/youtube/answer/14151606?hl=en) 上探索 Lyria 3。该功能已在美国上线,现正逐步向其他国家的 YouTube 创作者推出,Lyria 3 将提升每个独特 Shorts 配乐的质量。无论是创作歌词段落还是氛围感十足的背景音乐,更好地定制配乐能力将让创作者的 Shorts 更上一层楼。
## 全新音频验证能力
在 Gemini 应用中生成的所有曲目均嵌入了 [SynthID](https://deepmind.google/models/synthid/),这是我们用于识别 Google AI 生成内容的不可见水印。我们还为用户提供更多工具以帮助识别 AI 内容,扩展了 Gemini 应用中的[验证](https://support.google.com/gemini/answer/16722517?hl=en&co=GENIE.Platform%3DDesktop)能力,新增音频识别,与图像和视频识别并列。只需上传文件并询问是否由 Google AI 生成,Gemini 将检测 SynthID 并运用自身推理返回结果。
## 我们负责任地开发生成式 AI 的承诺
自 2023 年首次推出 Lyria 以来,我们一直与音乐界合作,以负责任的方式开发这项技术。通过这些合作以及我们的实验项目(如 [Music AI Sandbox](https://deepmind.google/blog/music-ai-sandbox-now-with-new-features-and-broader-access/)),我们学到了很多,并在训练 Lyria 3 时非常注重版权和合作伙伴协议。
Lyria 3 的音乐生成旨在支持原创表达,而非模仿现有艺术家。如果你的提示词提及特定艺术家,Gemini 会将其视为广泛的创作灵感,生成风格或氛围相似的曲目。我们还设置了过滤器,检查输出内容与现有内容的匹配度。我们认识到这种方法可能并非万无一失,因此你可以[举报](https://support.google.com/gemini/answer/13275746?hl=en&co=GENIE.Platform%3DAndroid)可能侵犯你或他人权利的内容。此外,使用我们的产品时,用户必须遵守我们的[服务条款](https://policies.google.com/terms?e=-IdentityBoqPoliciesUiGoodallSSAT::Launch,IdentityBoqPoliciesUiAdditionalAup::Launch#toc-what-we-expect)和[生成式 AI 禁止用途政策](https://policies.google.com/terms/generative-ai/use-policy),这些政策禁止侵犯他人知识产权和隐私权的行为。
Lyria 3 现已在 Gemini 应用中面向 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,计划扩展质量并覆盖更多语言。桌面端今日上线,移动应用将在未来几天内推出。Google AI Plus、Pro 和 Ultra 订阅用户将享受更高的使用限额。
我们在 Gemini 应用中推出音乐生成功能的目标是帮助你为日常生活添加有趣、定制的配乐。今天就到 [gemini.google.com](http://gemini.google.com/music) 试试吧。
相似文章
Google AI Blog
Google 已发布 Lyria 3,这是其最新的音乐生成模型,开发者可通过 Gemini API 和 Google AI Studio 获取。该模型提供两个版本:适用于完整歌曲创作的 Lyria 3 Pro 和适用于制作较短片段的 Lyria 3 Clip,支持对节奏、歌词的调节以及图像转音乐的多模态输入。
YouTube AI Channels
Google 的 Lyria 3 Pro AI 音乐生成器现已能输出完整 2–3 分钟、可商用免版税的歌曲,并通过 Gemini 或 Artlist 支持自定义歌词,为零音乐基础的创作者提供实用工作流。
YouTube AI Channels
Google Senior Product Manager Joel Yawili discusses the features and philosophy behind Lyria 3 and Lyria 3 Pro, highlighting improvements in song length, structure control, and multimodal integration with Gemini.
Google DeepMind Blog
Google DeepMind 推出 Gemini 2.0,这是一款新型智能体 AI 模型,具备原生图像和音频输出、增强的工具使用能力和多模态功能,专为下一代 AI 智能体设计。Gemini 2.0 Flash 现已向开发者推出,计划于 2025 年初实现更广泛的可用性。
Google DeepMind Blog
Google 发布了其迄今为止最智能的模型 Gemini 3,具备增强的推理能力和多模态功能。该模型现已集成到 Google 各产品中,面向 Ultra 订阅用户的「深度思考」复杂问题求解模式即将推出。