@mustafasuleyman: 非常兴奋地宣布今天推出七款全新的世界级MAI模型。它们代表了我们认为是AI设计的新时代……

X AI KOLs Following 模型

摘要

微软宣布推出七款新的MAI模型,包括一个强大的推理模型(MAI-Thinking-1)和编程模型(MAI-Code-1-Flash),以及用于企业定制化的Frontier Tuning。

今天我们非常兴奋地宣布推出七款全新的世界级MAI模型。它们代表了我们认为是AI设计的新时代,旨在让您保持掌控并处于前沿。 首先是我们的文本基础模型MAI-Thinking-1,在推理和SWE任务上表现异常出色。 - 它拥有350亿活跃参数的MoE(专家混合)架构,搭配256K上下文窗口。来自Surge的独立人类评估者在与Sonnet 4.6的盲测对比中,更青睐它的整体质量。此外,它在AIME 2025上取得了97%的分数,这是衡量其通用推理能力的关键指标。 - 它在SWE Bench Pro上达到53%,与Opus 4.6并列,共同占据最难的编程基准之一。 - 此外,由于我们与自家芯片协同设计了模型,MAI-Thinking-1已针对我们的MAIA 200芯片进行了优化。与GB200进行直接对比测试时,我们发现,在MAIA 200上端到端运行MAI模型,每美元性能提升30%,同时每瓦性能提升1.4倍。 接下来是MAI-Image-2.5及其Flash变体。这两个超强模型目前在排行榜上位列第二,在图像编辑方面超越了Nano Banana 2的分数。 最后是MAI-Code-1-Flash,我们新推出的推理高效编程模型,专门针对VS Code和GitHub Copilot CLI进行了优化。 - Code-1-Flash在SWE Bench Pro上达到了51%,尽管只有50亿参数,其规模接近Haiku,但成本更低。 所有这些构成了Microsoft Frontier Tuning的基础。它让您能够自定义我们的模型,创建由您独家掌控的、针对特定企业的智能体。您可以将我们的模型变成您的模型。您的数据。您的智能体。您的护城河。 早期采用者已经看到了差异。当我们为麦肯锡的任务调优模型时,MAI实现了最高的胜率,在质量上超越GPT-5.5,同时成本降低10倍。 此外,我们非常兴奋能与梅奥诊所的优秀团队合作,共同训练一款面向医疗保健领域的新前沿AI模型。 我们今天的公告标志着通往人本主义超级智能道路上的又一个里程碑。您可以通过我们的最新博客了解更多信息以及其他新模型:https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/…
查看原文
查看缓存全文

缓存时间: 2026/06/02 19:39

超级兴奋地宣布今天推出七款全新的世界级 MAI 模型。它们代表了我们认为的人工智能新时代——旨在让您始终掌控,并始终处于前沿。

首先是我们的文本基础模型 MAI-Thinking-1,在推理和 SWE 任务上表现出色。

  • 它是一款拥有 35B 激活参数的 MoE 模型,上下文窗口为 256K。在 Surge 的盲测对比中,独立人工评估员认为其在整体质量上优于 Sonnet 4.6;在 AIME 2025 上达到 97%,这是衡量其通用推理能力的关键指标。
  • 在 SWE Bench Pro 上达到 53%,在最难的编程基准测试中与 Opus 4.6 持平。
  • 由于我们与自有芯片协同设计模型,MAI-Thinking-1 针对我们的 MAIA 200 芯片进行了优化。与 GB200 直接对比时,我们发现将 MAI 模型在 MAIA 200 上端到端运行时,每美元性能提升 30%,每瓦性能增益达 1.4 倍。

接下来是 MAI-Image-2.5 及其 Flash 变体。这两款超强模型目前在排行榜上位列第二,在图像编辑方面超越了 Nano Banana 2 的得分。

最后是 MAI-Code-1-Flash,我们新的推理高效编码模型,专为 VS Code 和 GitHub Copilot CLI 调优。

  • Code-1-Flash 在 SWE Bench Pro 上达到 51%,尽管只有 5B 参数,规模接近 Haiku,但成本更低。

这一切都是 Microsoft Frontier Tuning 的基础。它允许您定制我们的模型,创建完全由您控制的、特定于公司的专属智能体。您可以使我们的模型成为您的模型。您的数据。您的智能体。您的护城河。

早期采用者已经看到了不同。当我们为麦肯锡的任务调优模型时,MAI 取得了最高胜率,在质量上超越 GPT-5.5,同时成本降低至十分之一。

此外,我们非常兴奋能与 Mayo Clinic 的杰出团队合作,共同为医疗保健领域训练一款新的前沿 AI 模型。

我们今天的公告标志着通往人文主义超级智能道路上的又一个里程碑。您可以在我们的最新博客中了解更多关于我们及其他新模型的信息:https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/…


建造一台爬山机器:推出七款新的 MAI 模型 | Microsoft AI

来源:https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/ 除了在 Foundry 上分发并针对我们的第一方产品进行优化外,我们的模型还将通过 Open Router 以及 Fireworks (https://openrouter.ai/microsoft/mai-image-2.5) 和 Baseten (https://www.baseten.co/blog/mai-thinking-1/) 广泛提供给开发者。这是开发者首次能够自行调整模型的权重。

所有这些模型都建立在共享的基础之上,从零开始爬山,无需任何蒸馏。它们拥有相同的数据纪律、相同的基础设施和相同的评估框架。它们被设计为协同工作,并直接集成到人们日常使用的产品中。但模型本身只是故事的一部分。

最重要的转变在于您能用它们做什么。

为您适配

人工智能正在进入一个新阶段。通过真实世界环境中的强化学习,AI 首次能够完全适应特定工作流程的细节。我们称之为 Microsoft Frontier Tuning (https://learn.microsoft.com/en-us/microsoft-365/copilot/copilot-tuning-overview)。我们认为这是 AI 展现方式的未来。

在这种设置中,最有价值的数据是您的:智能体完成的实际工作痕迹、步骤序列、决策、以及定义组织内任务实际完成方式所采取的行动。

我们的强化学习环境(RLE)允许您的 MAI 模型直接从您的工作流程中学习。可以将其视为仅供您使用的 AI 训练场。

通过 Frontier Tuning,您正在构建自己的模型,在您的环境中使用您的数据进行训练,完全由您控制。您的机构知识成为模型的一部分,并且始终归您所有。更好的是,这种适配能够提升效率和性能。

在微软内部及客户中,Frontier Tuning 已证明定制模型既更好又更高效:我们为 Excel 调优的 MAI 模型与 GPT 5.4 性能相当,同时效率提升高达 10 倍。早期采用者在前沿也看到了类似的收益。当根据麦肯锡严格的企业标准进行调优时,MAI 在所有测试模型中取得了最高胜率,同时成本降低约 10 倍。

开发者和企业一直渴望 AI 能够按照他们的条件和要求交付。我们认为这是实现这一目标的重要一步。

与 Mayo Clinic 合作的前沿健康智能

有一些高度重要、高度敏感的领域(如医疗健康)需要更紧密的合作。这就是为什么今天我们同时宣布,Microsoft 与 Mayo Clinic 将合作共同创建一款面向医疗保健的前沿 AI 模型。该模型将结合 Mayo Clinic 世界领先的临床专业知识、去标识化的临床数据和纵向洞察,以及 Microsoft 的基础 AI 能力。

该模型将设计为在最大范围的临床推理和医疗保健用例中表现出色,达到当今通用系统无法企及的水平。

该模型将首先部署在 Mayo Clinic 自己的环境中——全球顶尖的医院系统。我们期望它能实现广泛的能力,包括更早、更准确的诊断和治疗计划。一旦验证完成,该模型将通过 Azure Foundry 提供给其他组织,使更多需要的人能够获得 Mayo Clinic 的专业知识。

这款前沿 AI 模型将由 Mayo Clinic 拥有,这加强了我们双方长期的承诺:患者信任、临床严谨性、安全性,以及对临床健康数据和 AI 的负责任管理。

我们的实验室

在 Microsoft AI,我们认识到通往前沿没有捷径。我们从零开始训练。我们不从其他实验室蒸馏模型,也不依赖未经授权或不透明的数据。我们的数据集是干净且经过适当授权的。系统的每个组件——从架构到训练流程再到后训练——都是我们自己构建的。我们与自己的 Maia 200 芯片协同设计,并且已经看到这些努力带来了 1.4 倍的效率提升。这一切都关乎 Microsoft 及其合作伙伴的长期自给自足。关乎您可以信赖的模型。

目标在于构建我们所谓的爬山机器:一个能够随着我们投入更多计算、更好数据和更精准评估而持续改进、循环迭代的组织。

我们认为科学严谨性对此至关重要。因此,对于我们做的每一件事,我们都会进行消融、测量和记录。我们在数据管道上投入巨大。我们在小团队中以短期、可证伪的目标工作,将速度与质量、专注与雄心相匹配。我们致力于透明。我们希望与您同行。这就是为什么今天我们发布了深入的安全和技术报告。

人文主义超级智能

这就是我们在 MAI 中构建的:一个模型家族,现已提供新版本。一个基于第一性原理、专注于长期能力的实验室。以及一种我们认为将定义 AI 下一阶段的新调优和所有权方法。

我们的最终目标是我们所谓的人文主义超级智能。这意味着先进的 AI 系统旨在服务人和组织,而非取代他们。这些系统必须始终是工具,由人类意图塑造,对人类监督负责,并最终服从人类目标。人——您——必须始终处于控制地位。

在未来一年,请做好准备,见证我们的计算能力和能力的快速扩展,我们将努力使这一雄心成为现实。这对 AI 来说是一个新阶段,对我们也是如此。

– MAI 团队

相似文章

微软的全新MAI模型

Simon Willison's Blog

微软宣布推出两款全新大语言模型(LLMs):MAI-Thinking-1(350亿参数推理模型)和MAI-Code-1-Flash(50亿参数代码模型)。两款模型均基于企业级、无污染的干净数据训练,且未使用第三方蒸馏技术。据称,在盲评中,MAI-Thinking-1的受欢迎程度超过了Sonnet 4.6。

微软首款高级推理 AI 正式登场

The Verge

微软在 Build 2026 大会上发布了旗舰推理 AI 模型 MAI-Thinking-1,同时推出其他六款新模型,这标志着微软在自研模型开发上迈出了重要一步。

MAI-Thinking-1

Hacker News Top

微软AI推出MAI-Thinking-1,这是一个350亿活跃参数的推理模型,从头训练,无需蒸馏,在软件工程和数学基准测试中表现强劲,同时强调干净数据和自给自足。