看见声音
摘要
Mariano Salcedo 是 MIT 新设音乐技术与计算研究生项目的首批学生之一,他正在利用神经元胞自动机生成由音乐音频流驱动的自再生视觉作品。
<p>作为 MIT 新设<a href="https://musictech.mit.edu/mtcgp/">音乐技术与计算研究生项目</a>的首批学生之一,Mariano Salcedo '25 正在研究人工智能与音乐视觉的交叉领域。</p><p>具体而言,他的研究生研究聚焦于神经元胞自动机(NCA),该技术将经典元胞自动机与机器学习技术相结合,以生成能够再生的图像。</p><p>当与音乐等刺激相结合时,这些图像可以"展示"声音的运动。</p><p>"这种方法让任何人都能够创建音乐驱动的视觉作品,同时利用自组织系统的表现力及其有时不可预测的动力学特性,"Salcedo 说道。通过他设计的网页界面,用户可以调整音乐能量与 NCA 系统之间的关系,从而使用任何音乐音频流创建独特的视觉表演。</p><p>"我希望这些视觉作品能够补充并提升聆听体验,"他说。</p><p>去年,Salcedo 获得了 MIT <a href="https://www.eecs.mit.edu/research/artificial-intelligence-decision-making/">人工智能与决策</a>专业的学士学位,他是音乐技术与计算领域的 Alex Rigopulos(1992届)研究员。在本科期间,他探索了机器学习中的信号处理,以及经典的信号理解方式如何帮助我们理解 AI。如今,他是音乐技术与计算研究生项目首届 cohort 中的五名硕士生之一。</p><p>该项目由音乐技术实践教授 <a href="https://mta.mit.edu/person/eran-egozy">Eran Egozy</a> '93, MNG '95 领导,是<a href="https://mta.mit.edu/">MIT 音乐与戏剧艺术</a>(隶属于<a href="https://shass.mit.edu/">人文、艺术与社会科学学院</a>)与<a href="https://engineering.mit.edu/">工程学院</a>的合作项目。它邀请从业者研究、发现并开发新的音乐计算方法。该项目还包括一个演讲系列,让学生和更广泛的 MIT 社区接触到音乐行业专业人士、艺术家、技术专家和其他研究人员。</p><p>Rigopulos '92, SM '94 是一名电子游戏设计师、音乐家,也是 <a href="https://www.harmonixmusic.com/">Harmonix Music Systems</a> 的前 CEO,该公司是他与 Egozy 于 1995 年共同创立的。Harmonix 现已成为 Epic Games 的一部分,Rigopulos 目前担任 Epic Games 音乐游戏开发总监。</p><p>"MIT 是我几十年前首次追求音乐技术热情的地方,那段经历为我长久而充实的职业生涯奠定了基础,"Rigopulos 说道。"因此,当 MIT 推出音乐技术高级学位项目时,我非常高兴地资助了一个奖学金,以助力这个令人兴奋的新项目。"</p><p>Egozy 对 Salcedo 的工作及其深入探索其可能性的承诺充满热情。"他是一个多学科研究者的杰出范例,深入思考如何最佳地利用技术来增强和扩展人类创造力,"他说道。</p><p>Salcedo 已被选中在 2026 年人文、艺术与社会科学学院的高级学位典礼上发表学生演讲。"这是一种荣誉,也令人望而生畏,"他说。"感觉责任重大,"尽管他渴望承担这一责任。他的入选也让 Egozy 感到高兴。"Mariano 被选为今年的 keynote 演讲人,我非常兴奋,"他热情地说道。</p><p><strong>转换方向</strong></p><p>在墨西哥和德克萨斯州长大的 Mariano Salcedo 无法轻易满足自己创作音乐的热情。"墨西哥的公立学校没有乐队,"他说。虽然有些家庭能够支付乐器和课程的费用,但像 Salcedo 这样的家庭则没有这么幸运。</p><p>"我一直热爱音乐,"他继续说道。"我是一名听众。"</p><p>Salcedo 最初以机械工程专业学生的身份进入 MIT,通过 <a href="https://www.questbridge.org/">Questbridge</a> 项目申请入学。"我听说如果你喜欢工程和科学,来 MIT 是个不错的选择,"他回忆道。"书呆子在这里受到欢迎和拥抱。"虽然他认真完成机械工程课程,但一次与 LLM 的偶然邂逅后,音乐和技术向他发出了召唤。</p><p>"我接触到了一个 LLM 聊天机器人,深受震撼,"他回忆道。"它在跟我对话。我既敬畏又害怕。"在与聊天机器人邂逅之后,Salcedo 将专业从机械工程转到了人工智能与决策。</p><p>"我基本上是在机械工程课程完成了三分之二之后重新开始的,"他说。他了解了 AI 带来的可能性,但也面临了一些困扰研究人员和开发者的挑战,包括其潜在威力、确保其负责任使用、人类偏见、代表性不足群体获取渠道有限,以及开发者缺乏多样性。他认为自己或许能够改变这一局面。</p><p>"我想,多一个人进入这个领域就能带来改变,"他说。</p><p>在完成本科学业期间,Salcedo 对音乐的热爱重新浮现。"我开始在 MIT 做 DJ,一下子就迷上了,"他说。虽然他没有学过传统乐器,但他发现自己可以用技术创造引人入胜的音景。"我买了一个数字音频工作站来帮助我制作音乐,"他继续说道。</p><p>Egozy 和 Salcedo 于 2024 年相识,当时 Salcedo 在 Egozy 的实验室完成 <a href="https://urop.mit.edu/">本科生研究机会项目</a>(UROP)轮岗,担任游戏开发者。"他非常好奇,在很短的时间内就取得了巨大的成长,"Egozy 说道。Egozy 成为了 Salcedo 的非正式但重要的导师。"他为工作带来了极大的能量和深思熟虑,也支持着[音乐技术与计算研究生项目]中的其他人,"Egozy 评价道。</p><p>Salcedo 还选修了 Egozy 的课程 21M.385/21M.585/6.4450(交互式音乐系统),这进一步激发了他对创造力的渴望,同时也满足了他对音乐可能性的迷恋。通过选修 HASS 课程,他进一步加深了对音乐理论及相关技术的理解。</p><p>"我选修了 Leslie Tilley 教授的课程 21M.240(音乐批判性思维),这为我理解音乐创作建立了宝贵的框架,"他说,"而像 6.3000(信号处理)这样的课程则帮助我将直觉与科学联系起来。"</p><p><strong>跨学科工作</strong></p><p>虽然 Salcedo 对自己的音乐和研究充满热情,但他也致力于与同学建立关系。他是 Sigma Nu 兄弟会的成员,他说自己在那里"找到了家和社区"。他还在 2023 年夏天参加了 <a href="https://misti.mit.edu/">MISTI</a> 智利之旅,在那里进行音乐技术研究。Salcedo 赞扬了 MIT 的友爱文化,并感激其对自己学者工作的影响。"MIT 教会了我如何学习,"他说。</p><p>教授们鼓励她展示自己的研究和发现。他在 2026 年 1 月于新加坡举行的 <a href="https://aaai.org/">AAAI</a>(人工智能促进协会)会议上展示了自己的工作——<a href="https://openreview.net/forum?id=tkGnjTNHm2">Artificial Dancing Intelligence: Neural Cellular Automata for Visual Performance of Music</a>。</p><p>Salcedo 相信他的研究有可能超越音乐可视化。"如果我们能改进建模自组织系统的方式呢?"他问道,"也就是说,像多细胞生物、鸟群或社会这样的系统,它们通过局部互动却展现出有趣的行为。"Salcedo 说,任何整体大于部分之和的系统都是如此。</p>
查看缓存全文
缓存时间: 2026/05/08 09:00
# 看见声音
来源:https://news.mit.edu/2026/seeing-sounds-mariano-salcedo-0326
作为MIT新设音乐技术与计算研究生项目(https://musictech.mit.edu/mtcgp/)的首批学生之一,Mariano Salcedo '25正在研究人工智能与音乐视觉化的交叉领域。
具体而言,他的研究生研究聚焦于**神经细胞自动机(Neural Cellular Automata, NCA)**,该技术将经典细胞自动机与机器学习技术相结合,生成能够再生的图像。
当这些图像与音乐等刺激配对时,便能"看见"声音的动态呈现。
"这种方法让任何人都能创作音乐驱动的视觉作品,同时利用自组织系统所具有的表达力和有时不可预测的动力学特性,"Salcedo说道。通过他设计的网页界面,用户可以调节音乐能量与NCA系统之间的关系,利用任意音乐音频流创造独特的视觉演出。
"我希望视觉作品能够补充并提升聆听体验,"他说。
去年,Salcedo作为Alex Rigopulos(1992届)音乐技术与计算研究员,获得了MIT人工智能与决策制定(https://www.eecs.mit.edu/research/artificial-intelligence-decision-making/)学士学位。在校期间,他探索了机器学习中的信号处理,以及经典的信号理解方式如何帮助我们理解AI。如今,他是音乐技术与计算研究生项目首届 cohort 的五名硕士生之一。
该项目由音乐技术实践教授Eran Egozy(https://mta.mit.edu/person/eran-egozy)'93,MNG '95领导,是MIT音乐与戏剧艺术系(https://mta.mit.edu/)(隶属于人文、艺术与社会科学学院(https://shass.mit.edu/))与工程学院(https://engineering.mit.edu/)的合作项目。该项目邀请从业者研究、探索和开发音乐计算的新方法,还包括一个演讲系列,让学生和更广泛的MIT社区接触音乐产业专业人士、艺术家、技术专家和其他研究人员。
Rigopulos '92,SM '94是视频游戏设计师、音乐家,曾任Harmonix Music Systems(https://www.harmonixmusic.com/)首席执行官。该公司是他与Egozy于1995年共同创立的。Harmonix现已成为Epic Games的一部分,Rigopulos担任音乐游戏开发总监。
"MIT是我几十年前首次追求音乐技术热情的地方,那段经历为我长期而充实的职业生涯奠定了基础,"Rigopulos说,"因此,当MIT推出音乐技术高级学位项目时,我非常激动能够资助一个奖学金,助力这个令人兴奋的新项目。"
Egozy对Salcedo的工作及其深入探索的承诺充满热情。"他是多学科研究者的杰出典范,深入思考如何最佳地利用技术来增强和拓展人类创造力,"他说。
Salcedo已被选中在2026年人文、艺术与社会科学学院高级学位典礼上发表学生演讲。"这是一项荣誉,也令人望而生畏,"他说,"感觉责任重大,"尽管他渴望承担这一责任。他的入选也让Egozy感到高兴。"Mariano被选为今年的 keynote 演讲者,我非常兴奋,"他热情地说道。
**转变方向**
在墨西哥和德克萨斯州长大的Mariano Salcedo,无法轻易满足自己创作音乐的热情。"墨西哥的公立学校没有乐队,"他说。虽然有些家庭能负担得起乐器和课程,但像Salcedo家这样的家庭就没那么幸运了。
"我一直热爱音乐,"他继续说道,"我是个听众。"
Salcedo最初以机械工程系学生的身份进入MIT,通过Questbridge(https://www.questbridge.org/)项目申请入学。"我听说如果你喜欢工程和科学,来MIT会是个很棒的选择,"他回忆道,"书呆子在这里受到欢迎和拥抱。"虽然他认真完成机械工程课程,但在偶然接触到一个大语言模型后,音乐与技术向他发出了召唤。
"我接触到了一个LLM聊天机器人,被震撼到了,"他回忆道,"这个东西在和我对话。我既敬畏又害怕。"与聊天机器人的这次邂逅后,Salcedo将专业从机械工程转到了人工智能与决策制定。
"基本上,在完成机械工程三分之二的课程后,我重新开始了,"他说。他了解了AI带来的可能性,但也直面了一些困扰研究人员和开发者的挑战,包括其潜在威力、确保负责任地使用、人类偏见、弱势群体获取渠道有限,以及开发者缺乏多样性等问题。他决定或许能改变这一现状。
"我想,多一个人进入这个领域就能带来改变,"他说。
在完成本科学业期间,Salcedo对音乐的热爱重新浮现。"我开始在MIT做DJ,然后就迷上了,"他说。虽然他还没学会演奏传统乐器,但发现自己可以用技术创作引人入胜的声音景观。"我买了数字音频工作站来帮我做音乐,"他继续说道。
Egozy和Salcedo于2024年相识,当时Salcedo在Egozy的实验室完成本科生研究机会项目(https://urop.mit.edu/)轮岗,担任游戏开发者。"他好奇心极强,在很短的时间内就取得了巨大进步,"Egozy说。Egozy成为了Salcedo非正式但重要的导师。"他为工作和支持音乐技术与计算研究生项目中的其他人带来了充沛的精力和深思熟虑的态度,"Egozy评价道。
Salcedo还选修了Egozy的课程:21M.385/21M.585/6.4450(交互式音乐系统),这进一步满足了他对创造力的渴望,同时也让他得以探索音乐的无限可能。通过选修HASS课程,他进一步深化了对音乐理论及相关技术的理解。
"我选修了Leslie Tilley教授的21M.240(音乐批判性思维),这门课为理解音乐创作建立了宝贵的框架,"他说,"而像6.3000(信号处理)这样的课程则帮助我将直觉与科学联系起来。"
**跨学科工作**
虽然Salcedo对自己的音乐和研究充满热情,他也致力于与同学建立关系。他是Sigma Nu兄弟会的成员,在那里他"找到了归属和社区"。2023年夏天,他还参加了MISTI(https://misti.mit.edu/)智利之行,在当地进行音乐技术研究。Salcedo赞扬MIT的友爱文化,并感激它对自己学术工作的影响。"MIT教会了我如何学习,"他说。
教授们鼓励他展示自己的研究成果。他于2026年1月在新加坡举行的美国人工智能促进协会(https://aaai.org/)会议上展示了自己的论文——《Artificial Dancing Intelligence: Neural Cellular Automata for Visual Performance of Music》(https://openreview.net/forum?id=tkGnjTNHm2)。
Salcedo相信他的研究有可能超越音乐可视化。"如果我们能改进建模自组织系统的方式呢?"他问道,"也就是说,像多细胞生物、鸟群或社会这样的系统,它们通过局部互动却展现出有趣的行为。"任何整体大于部分之和的系统,Salcedo说。
开发用于设计其应用程序的技术,可能有助于回答关于AI持续扩张和发展的重要伦理问题。通往其工作发展的道路既令人望而生畏又孤独,但这些挑战激发了他的工作热情。
"当学术界目前都聚焦在LLM上时,走这条路是令人畏惧的,"他说,"但在深入更细致的工作之前,解释和探索基础技术也很重要,这能帮助受众更好地理解它。"知道有教授们的支持,Salcedo得以保持对自己想法的热情。"他们只要求我们将兴趣建立在研究基础上,"他说。
他的探索正在影响他作为音乐人的工作。"因为我上的课,我的音乐变得更有趣了,"他说。他还对理解学术界和世界听到谁的音乐感兴趣,探索经典曲目中对西方音乐的偏见,以及如何减少与音乐价值相关的偏见。
"我们作为技术专家所做的工作,远没有我们被引导相信的那么主观,"他认为。
Salcedo特别感激在MIT期间获得的支持。"项目教师鼓励各种追求,"他说,"并要求我们推进个人目标,而不是聚焦在他们自己的目标上。"在研究生项目期间,他兴奋地注意到自己经常被挑战去追求自己的想法。
最终,Salcedo希望人们能体验到他在人文与科学交叉领域工作的乐趣。音乐和技术几乎影响着每个人。邀请观众以参与者的身份进入他的实验室,参与创意和研究过程,这给他带来了与创作出色节拍或解决棘手技术挑战同样的满足感。帮助观众理解其工作的价值,推动着他不断前进。
"我希望用户能感受到律动,更充分地探索声音及其影响,"他说。
相似文章
Music AI Sandbox 推出新功能,访问权限扩大
Google DeepMind 扩展了 Music AI Sandbox,新增功能包括 Lyria 2 音乐生成模型,并向美国音乐人开放更广泛的访问权限,通过用于生成、扩展和编辑音乐内容的工具来实现 AI 辅助音乐创作。
ArtifactNet:通过法证残差物理学检测AI生成音乐
ArtifactNet是一个轻量级神经网络框架,通过分析音频信号中的编码器特定工件来检测AI生成的音乐,在新的6,183轨道基准测试(ArtifactBench)上达到F1=0.9829,参数量比竞争方法少49倍。该方法采用法证物理学原理,通过有界掩码UNet和紧凑型CNN提取编码器残差,编码器感知训练将跨编码器漂移减少83%。
MuseNet
OpenAI 发布了 MuseNet,一个基于 GPT-2 架构的深度神经网络,通过从数十万个 MIDI 文件中学习模式,能够生成 4 分钟的音乐作品,包含 10 种乐器。该模型可以结合多种音乐风格并以新颖的方式融合它们。
最佳本地AI音乐生成器来了!免费无限制
ACE-Step 1.5 XL是一款开源音乐生成器,在质量与速度上超越Suno与Udio,仅需12 GB GPU即可无限运行,生成速度约120×实时。
用全新生成媒体模型和工具激发你的创意
Google 发布了 Veo 3 和 Imagen 4,这是下一代视频和图像生成模型,具有显著的能力提升,包括音频生成和增强的物理模拟。该公司还推出了 AI 电影制作工具 Flow,并扩大了 Lyria 2 音乐创作工具的访问权限。