全新自我表达方式:Gemini现已支持音乐创作

Google DeepMind Blog 产品

摘要

Google DeepMind将新一代生成式音乐模型Lyria 3集成至Gemini应用,用户可通过文本或图像提示创作包含歌词与器乐的自定义曲目。

Gemini应用现已搭载我们最先进的音乐生成模型Lyria 3,让每个人都能通过文本或图像创作30秒音乐片段。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/08 09:17

# 全新自我表达方式:Gemini 现已支持音乐创作 来源:https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/ 自 Gemini 应用推出以来,我们已构建多种工具,鼓励用户通过图像和视频进行创意表达。今天,我们更进一步:推出[自定义音乐生成](https://gemini.google/overview/music-generation/?utm_source=gemini&utm_medium=web&utm_campaign=lyria_marketing_keyword)功能。[Lyria 3](https://deepmind.google/models/lyria/) —— Google DeepMind 最新的生成式音乐模型,今日起在 Gemini 应用中开启 Beta 测试。只需描述一个创意或上传一张照片,例如"一首关于袜子找到另一半的搞笑 R&B 慢歌",短短几秒钟内,Gemini 就能将其转化为高质量、朗朗上口的曲目。若想进一步突破创意边界,你还可以让 Gemini 从你上传的内容中汲取灵感。 Lyria 3 在音频生成方面相比前代 Lyria 模型有三项重要提升: 1. 无需自己提供歌词!系统会根据你的提示词自动生成。 2. 你对风格、人声、节奏等元素的创作控制力更强。 3. 可以创作出更真实、音乐性更复杂的曲目。 以下是使用方法: - **文本生成曲目:** 描述特定流派、情绪、内部玩笑或回忆,创作带有歌词或纯器乐的独特曲目,贴合你的氛围。*"我感到怀旧。为我的母亲创作一首曲目,关于我们小时候的美好时光,以及她在家煮大蕉的记忆。做成一首有趣的 afrobeat 风格曲目,带有真正的非洲氛围。"* - **照片和视频生成曲目:** 上传照片或视频,观看 Gemini 利用内容创作完美契合情绪的曲目,并配有相应歌词。*"用这些照片创作一首关于我的狗狗 Duncan 在森林徒步的曲目。"* Gemini 应用可生成 30 秒的曲目,并由 Nano Banana 生成自定义封面艺术。通过下载或点击分享链接,你可以轻松快速地与朋友分享。这些曲目的目标并非创作音乐杰作,而是为你提供一种有趣、独特的自我表达方式。 您的浏览器不支持音频元素。 创作者还可以在 YouTube 的 [Dream Track](https://support.google.com/youtube/answer/14151606?hl=en) 上探索 Lyria 3。该功能已在美国上线,现正逐步向其他国家的 YouTube 创作者推出,Lyria 3 将提升每个独特 Shorts 配乐的质量。无论是创作歌词段落还是氛围感十足的背景音乐,更好地定制配乐能力将让创作者的 Shorts 更上一层楼。 ## 全新音频验证能力 在 Gemini 应用中生成的所有曲目均嵌入了 [SynthID](https://deepmind.google/models/synthid/),这是我们用于识别 Google AI 生成内容的不可见水印。我们还为用户提供更多工具以帮助识别 AI 内容,扩展了 Gemini 应用中的[验证](https://support.google.com/gemini/answer/16722517?hl=en&co=GENIE.Platform%3DDesktop)能力,新增音频识别,与图像和视频识别并列。只需上传文件并询问是否由 Google AI 生成,Gemini 将检测 SynthID 并运用自身推理返回结果。 ## 我们负责任地开发生成式 AI 的承诺 自 2023 年首次推出 Lyria 以来,我们一直与音乐界合作,以负责任的方式开发这项技术。通过这些合作以及我们的实验项目(如 [Music AI Sandbox](https://deepmind.google/blog/music-ai-sandbox-now-with-new-features-and-broader-access/)),我们学到了很多,并在训练 Lyria 3 时非常注重版权和合作伙伴协议。 Lyria 3 的音乐生成旨在支持原创表达,而非模仿现有艺术家。如果你的提示词提及特定艺术家,Gemini 会将其视为广泛的创作灵感,生成风格或氛围相似的曲目。我们还设置了过滤器,检查输出内容与现有内容的匹配度。我们认识到这种方法可能并非万无一失,因此你可以[举报](https://support.google.com/gemini/answer/13275746?hl=en&co=GENIE.Platform%3DAndroid)可能侵犯你或他人权利的内容。此外,使用我们的产品时,用户必须遵守我们的[服务条款](https://policies.google.com/terms?e=-IdentityBoqPoliciesUiGoodallSSAT::Launch,IdentityBoqPoliciesUiAdditionalAup::Launch#toc-what-we-expect)和[生成式 AI 禁止用途政策](https://policies.google.com/terms/generative-ai/use-policy),这些政策禁止侵犯他人知识产权和隐私权的行为。 Lyria 3 现已在 Gemini 应用中面向 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,计划扩展质量并覆盖更多语言。桌面端今日上线,移动应用将在未来几天内推出。Google AI Plus、Pro 和 Ultra 订阅用户将享受更高的使用限额。 我们在 Gemini 应用中推出音乐生成功能的目标是帮助你为日常生活添加有趣、定制的配乐。今天就到 [gemini.google.com](http://gemini.google.com/music) 试试吧。

相似文章

使用 Lyria 3 进行开发:我们最新的音乐生成模型

Google AI Blog

Google 已发布 Lyria 3,这是其最新的音乐生成模型,开发者可通过 Gemini API 和 Google AI Studio 获取。该模型提供两个版本:适用于完整歌曲创作的 Lyria 3 Pro 和适用于制作较短片段的 Lyria 3 Clip,支持对节奏、歌词的调节以及图像转音乐的多模态输入。

如何用 Lyria 3 Pro 制作真正好听的 AI 音乐

YouTube AI Channels

Google 的 Lyria 3 Pro AI 音乐生成器现已能输出完整 2–3 分钟、可商用免版税的歌曲,并通过 Gemini 或 Artlist 支持自定义歌词,为零音乐基础的创作者提供实用工作流。

推出 Gemini 2.0:我们为智能体时代打造的新型 AI 模型

Google DeepMind Blog

Google DeepMind 推出 Gemini 2.0,这是一款新型智能体 AI 模型,具备原生图像和音频输出、增强的工具使用能力和多模态功能,专为下一代 AI 智能体设计。Gemini 2.0 Flash 现已向开发者推出,计划于 2025 年初实现更广泛的可用性。

Gemini 3 开启智能新时代

Google DeepMind Blog

Google 发布了其迄今为止最智能的模型 Gemini 3,具备增强的推理能力和多模态功能。该模型现已集成到 Google 各产品中,面向 Ultra 订阅用户的「深度思考」复杂问题求解模式即将推出。