@MSFTResearch:MatterSim 正在拓展人工智能在材料科学中的应用——从更快速的大规模模拟到新的MatterSim-MT,……
摘要
微软研究院宣布了MatterSim的更新,包括MatterSim-MT,这是一个用于材料表征的多任务基础模型,更快的模拟(速度提升3-5倍),以及一种新材料热导率预测的实验验证。
查看缓存全文
缓存时间: 2026/05/12 14:53
MatterSim 正在拓展人工智能在材料科学领域的应用——从更快速的大规模模拟,到 MatterSim-MT,一种用于模拟超越势能面本身的多任务新模型。 https://t.co/l5bSMkdSrt https://t.co/qQam2GvXDo
MatterSim 通过更快速的模拟和新的多任务模型拓展材料发现
来源:https://www.microsoft.com/en-us/research/blog/advancing-ai-for-materials-with-mattersim-experimental-synthesis-faster-simulation-and-multi-task-models/ 在蓝到紫到粉渐变背景上的三个极简白线图标:蜂窝状、流程图图标、带圆圈对勾的科学烧杯## 概览
- 实验验证:通过使用 MatterSim-v1 进行高通量筛选,我们先前(https://www.microsoft.com/en-us/research/podcast/abstracts-heat-transfer-and-deep-learning-with-hongxia-hao-and-bing-lv/)确定了四方相磷化钽(TaP)作为一种潜在的高性能导热体。现在,我们已实验合成该材料并测量其热导率为 152 W/m/K,接近硅的热导率。
- 更快速的模拟:我们将 MatterSim-v1 模型推理加速了 3-5 倍,并将其集成到 LAMMPS 软件包中,支持跨多个 GPU 进行大规模模拟。
- 新模型发布:我们推出了 MatterSim-MT,一种用于计算材料表征的多任务基础模型,能够模拟超越势能面单独可捕获的复杂多属性现象。
材料设计是众多技术进步的基础,从纳米电子学到半导体设计再到能源存储。然而,新型材料的开发周期仍然缓慢且昂贵。通用机器学习原子间势能旨在通过为多种材料提供准确的稳定性和性质预测来加速材料设计过程。这些模型比传统的第一性原理模拟快数个数量级,将以前不可行的问题转化为可在数小时内完成的常规计算。自从我们推出(https://www.microsoft.com/en-us/research/publication/mattersim-a-deep-learning-atomistic-model-across-elements-temperatures-and-pressures/)MatterSim-v1 模型以来,它因其能够在实际条件(包括有限温度和压力)下准确模拟材料而在材料科学界广受欢迎。
今天,我们有几个令人兴奋的 MatterSim 更新与大家分享。其中包括 MatterSim 对导热体预测的实验验证、性能改进以实现更快速模拟,以及引入一种用于材料表征的新多任务基础模型。
实验验证
右侧:MatterSim 热导率预测与真实模拟及实验的散点对比图。该图显示了良好的一致性。左侧:实验合成的四方相磷化钽样品的不同视图。 图 1:基于 MatterSim 的计算预测,我们合成了一种潜在的高导热体。左侧:MatterSim 热导率预测与真实模拟及实验的对比(示出 ±50% 误差带作为参考)。右侧:实验合成的四方相磷化钽(TaP)样品的不同视图,测得热导率为 152 W/m/K。
高导热材料在热量管理中起着关键作用,可防止过热并提高能源效率。例如,金刚石、铜和硅等已确立的高导热体广泛用于各种冷却应用。设计下一代导热体可能会推动计算、电力电子和航空航天技术的进步。然而,这需要对候选材料的热导率值进行准确预测。
在固体中,热量主要通过两种方式传递:振动原子(声子)和移动电子。声子贡献可使用机器学习原子间势能来估算,从而实现对数千种候选材料进行筛选,将搜索空间缩小到最有前景的材料,然后进行昂贵的实验验证。
“MatterSim 生成了迄今为止最大的计算热导率数据库。这为探索比以往更广阔的材料空间打开了大门 […]。”——德克萨斯大学达拉斯分校 Bing Lv 教授
与德克萨斯大学达拉斯分校(UT Dallas)、伊利诺伊大学厄巴纳-香槟分校和加利福尼亚大学戴维斯分校(UC Davis)合作,我们使用 MatterSim-v1 筛选了超过 240,000 种候选材料以寻找高导热体。如图 1(左)所示,MatterSim 的预测与第一性原理模拟具有良好的一致性。加州大学戴维斯分校的 Davide Donadio 教授表示:“MatterSim 模型将准确性和计算效率结合起来,预测热导率这样敏感的属性,让我感到惊讶。这正是解锁如此规模筛选(数十万种晶体)的关键,而使用传统方法完全无法达到。”德克萨斯大学达拉斯分校的 Bing Lv 教授补充道:“MatterSim 生成了迄今为止最大的计算热导率数据库。这为探索比以往更广阔的材料空间打开了大门,使学术界即使在施加实际要求后也能发现更广泛的一组合适材料。”
“我们首次能够在大规模尺度上检验关于何种因素控制热导率的传统认知 […]”——伊利诺伊大学厄巴纳-香槟分校 David Cahill 教授
基于这些预测,我们确定了四方相磷化钽(TaP)作为一种潜在的高导热体。我们在德克萨斯大学达拉斯分校实验合成了四方相磷化钽(TaP),并在伊利诺伊大学厄巴纳-香槟分校测量了其热导率(最佳样品为 152 W/m/K),接近硅的热导率。尽管我们并非首次合成四方相 TaP,但该材料此前并未被视为导热体。这些结果证明了 MatterSim 如何能够实现功能材料的识别:“我们首次能够在大规模尺度上检验关于何种因素控制热导率的传统认知,同时能够发现新的功能材料,使其在质量密度、元素丰度和环境稳定性等其他重要约束之间取得平衡,”伊利诺伊大学厄巴纳-香槟分校的 David Cahill 教授说道。
视频系列
On Second Thought with Sinead Bovell (https://www.microsoft.com/en-us/research/story/on-second-thought/)
On Second Thought
一个与 Sinead Bovell 围绕每个人都在问的关于 AI 的问题展开的视频系列。通过与微软内部专家声音的合作,我们剖析这一快速变化的技术所带来的紧张与承诺,探索正在演变的内容以及可能性。
性能改进
我们通过发布多个开源性能与可用性改进,使 MatterSim-v1 显著更快。首先,我们通过结合更快的图构建、提前编译以及减少原子表示之间的转换来加速模型推理,从而实现 MatterSim-v1.0.0-5M 的 3 倍加速和 MatterSim-v1.0.0-1M 的 5 倍加速(见图 2)。为使 MatterSim-v1 更易于使用,我们将其集成到广泛使用的 LAMMPS 模拟软件中,使用户能够轻松地在现有工作流程中跨多个 GPU 扩展模型推理。
柱状图比较了先前和更新后的 MatterSim 版本的推理时间。该图显示 500 万参数模型加速 3 倍,100 万参数模型加速 5 倍。 图 2:MatterSim-v1.0.0-5M 推理速度提升 3 倍,MatterSim-v1.0.0-1M(Python)推理速度提升 5 倍。
新模型发布
在 MatterSim-v1 成功的基础上,今天我们通过宣布 MatterSim-MT 来扩展 MatterSim 模型家族:一个用于计算材料模拟和属性表征的多任务(MT)基础模型。该模型原生预测能量、力、应力和多种重要材料属性。
MatterSim-MT 在超过 3500 万个标记了第一性原理的结构上进行预训练,涵盖 89 种元素、温度高达 5000 K 和压力高达 1000 GPa。它进一步在各种属性上进行微调,包括 Bader 电荷、磁矩、Born 有效电荷和介电矩阵。开箱即用,MatterSim-MT 可作为预测材料结构、动力学和热力学的基础模型。其多任务架构还支持一系列无法仅通过势能面捕获的复杂模拟。准确模拟这些现象的能力对于催化和能源存储等应用至关重要。
在此,我们通过三个案例研究来说明这些多任务能力:振动光谱、铁电开关和电化学氧化还原。每个示例都需要不同属性预测的组合。 在完整论文(https://www.microsoft.com/en-us/research/publication/mattersim-mt-a-multi-task-foundation-model-for-in-silico-materials-characterization/)中,我们还展示了 MatterSim-MT 能够随着更多数据和参数良好扩展,可以有效微调到更高理论水平,并可以通过主动学习系统性地扩展到新系统。
左上:材料的原子表示以及模型多任务能力概览。右上:碳化硅(SiC)在高达 100 GPa 压力下的声子谱。左下:铁电四方相钛酸钡材料中极化密度随 z 方向电场变化的预测迟滞回线。右下:二氧化锰锂在脱锂过程中氧 Bader 电荷分布的演变,箭头表示氧分子的形成。 图 3:MatterSim-MT 的多任务预测能力使得模拟复杂材料现象成为可能。(a) MatterSim-MT 多任务推理能力的说明,包括从原子结构预测能量 (E)、力 (F)、应力 (S)、磁矩 (μ)、Born 有效电荷 (Z∗) 和介电矩阵 (ε∞)。(b) 碳化硅 (SiC) 在高达 100 GPa 压力下的声子谱,插图中比较了 MatterSim 预测的纵向光学 (LO) 和横向光学 (TO) 分裂与实验测量值。(c) 铁电四方相 BaTiO3 材料中极化密度随 z 方向电场变化的预测迟滞回线。(d) Li1.2–xMn0.8O2 在脱锂过程中氧 Bader 电荷分布的演变,箭头表示 O2 分子的形成。
首先,我们关注振动光谱,这是一种通过测量原子键自然振动来识别物质的技术。我们演示了 Born 有效电荷和介电属性的预测如何能够计算极性晶体中的声子谱。在这些材料中,带相反电荷的离子相互振动。根据振动方向,这可能导致电荷累积,从而产生宏观电场,将光学声子模分裂为更高频率的纵向 (LO) 和更低频率的横向 (TO) 分支。作为一个案例研究,我们模拟了 3c-碳化硅(3c-SiC,一种用于高功率电子学的材料)在极端压力下的这种行为。如图 3(b) 所示,MatterSim-MT 预测的 Born 有效电荷与理论和实验值都非常吻合。得到的 LO-TO 分裂为 5.26 THz,与从头计算结果相差仅 0.06 THz,与实验测量值相差仅 0.03 THz。
预测的 Born 有效电荷还允许我们模拟系统如何响应外部电场。在铁电材料中,离子采用不对称排列,使晶体具有净电极化,该极化可以通过外加电场翻转。在图 3(c) 中,我们通过模拟钛酸钡(BaTiO3)在外加电场下的行为来演示这一点,再现了其极化的开关。得到的迟滞回线正确显示了 300 K 下的有限温度效应使得极化更容易翻转,尽管预测的自发极化(38 μC/cm2)略高于实验值(26 μC/cm2)。这种差异很可能是由于底层第一性原理计算众所周知的欠束缚。
最后,我们预测原子电荷以研究化学键和氧化还原过程中的电子自由度。我们检查了正极材料 Li1.2–xMn0.8O2 在模拟电池充电过程中的行为。这些富锂过渡金属氧化物因其高能量密度而成为有前景的下一代电池,但存在与阴离子氧氧化还原机制相关的不可逆容量损失。我们通过运行 1000 K 下的分子动力学模拟并逐步提取锂来模拟电池充电,重现了这一现象。我们观察到随时间推移的明显转变:起初,锰(Mn)原子提供充电所需的电子,但随着更多锂被移除,氧原子被迫贡献电子(阳离子到阴离子氧化还原),如随时间推移 Bader 电荷向负值减小所示(图 3(d))。这导致结构不稳定,氧原子配对形成 O2 二聚体(图 3(d),插图)。值得注意的是,阳离子到阴离子氧化还原转变和晶格降解的全面图景自然地从多任务预测中涌现,而无需对电池材料进行任何特定任务训练。
下一步
通过实验验证、显著的性能改进和新的多任务能力,MatterSim 正在向更实用、与决策相关的材料设计应用迈进。这些进展共同帮助材料科学家更快地从大规模计算筛选转向有针对性的实验跟踪和与决策相关的科学工作流程。我们很高兴看到材料科学界如何在自己的领域应用这些进步。
我们期待在 MatterSim 被测试、扩展并集成到实际材料发现流程中时继续进行合作。
致谢
这项工作是一项高度协作和跨学科努力的成果,由微软研究院 AI for Science 牵头,与微软研究院 Accelerator 以及德克萨斯大学达拉斯分校(由 MSR Accelerator 支持)、伊利诺伊大学厄巴纳-香槟分校和加利福尼亚大学戴维斯分校的合作者共同完成。本工作的贡献者包括:Han Yang、Xixian Liu、Chenxi Hu、Yichi Zhou、Yu Shi、Chang Liu、Junfu Tan、Jielan Li、Guanzhi Li、Qian Wang、Yu Zhu、Zekun Chen、Shuizhou Chen、Fabian Thiemann、Claudio Zeni、Matthew Horton、Robert Pinsler、Andrew Fowler、Daniel Zügner、Tian Xie、Lixin Sun、Yicheng Chen、Lingyu Kong、Yeqi Bai、Deniz Gunceler、Frank Noé、Hongxia Hao、Ziheng Lu、Zixin Zhai、Mengfan Wu、Haoke Qiu、Mingfa Tang、Tie-Yan Liu、Haiguang Liu、Tao Qin、David G. Cahill、Bing Lv、Davide Donadio、Shoko Ueda 和 Kenji Takeda。
相似文章
@MSFTResearch:微软研究院推出了新的工具、模型、仓库和论文。使用AI和智能体?值得关注:• Mage…
微软研究在微软研究论坛虚拟系列中宣布了新的工具、模型、仓库和论文,包括MagenticLite、智能体驱动的GitHub工作流、验证优先的智能体以及语义匹配微调。
MIT研究人员利用AI揭示材料中的原子缺陷
MIT研究人员在《Matter》期刊上发表论文,介绍了一种AI模型,该模型利用非侵入式中子散射数据对材料中的原子缺陷进行分类和定量分析。该模型可同时检测多种缺陷类型,在不损坏材料的情况下改进半导体及其他材料的表征。
@MSFTResearch: 介绍GridSFM,一个能够毫秒级预测交流最优潮流的小型基础模型,提升效…
Microsoft推出GridSFM,这是一个小型基础模型,能够在毫秒内预测交流最优潮流,显著提高电网效率并降低拥堵成本。
@_vmlops: 微软研究人员构建了此工具用于训练530B参数模型 DeepSpeed 是一个深度学习优化库,……
DeepSpeed 是一个由微软开发的开源深度学习优化库,能够高效地实现大规模模型的分布式训练和推理,具备 ZeRO、3D 并行和 Mixture-of-Experts 等特性。
StampFormer: 一种物理引导的材料-几何耦合多模态模型,用于快速预测板料冲压中的物理场
StampFormer 是一种物理引导的深度学习框架,融合几何和材料属性,在不到一秒内预测板料冲压的有限元分析结果,相对误差低于8.5%,实现了高保真度。