@Modular：我们的内核团队整周都在深入研究 MiniMax M3。百万token上下文和原生多模态让它的服务模式变得困难……

X AI KOLs Following 2026/06/09 18:37 模型

mini-max-m3 1m-context multimodal open-weights serving modular kernel

摘要

Modular 的内核团队正在优化对 MiniMax M3 的百万token上下文和原生多模态的服务，开放权重即将发布，可立即在 Modular 上部署。

我们的内核团队整周都在深入研究 MiniMax M3。百万token上下文和原生多模态让它成为一个难以良好服务的模型，而这正是我们喜欢的那种挑战！当开放权重在未来几天内发布时，您将能够立即在 Modular 上运行它。敬请关注 @MiniMax_AI x Modular。

查看原文

查看缓存全文

缓存时间: 2026/06/10 00:20

我们的内核团队整个星期都在深入钻研 MiniMax M3。100 万 token 的上下文长度和原生多模态能力使得这个模型难以很好地服务，而这正是我们喜欢的那种挑战！

当开源权重在未来几天发布后，您将能够立即在 Modular 上运行它。

敬请关注 @MiniMax_AI 与 Modular 的后续动态。

相似文章

TLDR AI

MiniMax 通过 API 发布了 M3，这是一款拥有 100 万 token 上下文窗口并支持原生多模态输入的模型。该公司承诺在 10 天内发布开源权重和技术报告。

TLDR AI

MiniMax 推出了 M3，这是首个结合编程、智能体与多模态能力的开源权重模型，通过稀疏注意力机制支持高达 100 万 token 的上下文。

X AI KOLs Following

MiniMax发布了M3，一个开放权重模型，结合了前沿编码、1M上下文和原生多模态能力，性能与Opus相当，但成本仅为其一小部分。

TLDR AI

MiniMax 发布了关于其 M2 系列的详细技术报告，并预告了即将推出的 M3 模型。该模型采用一种新颖的稀疏注意力机制，在百万 token 上下文中实现高达 15.6 倍的解码速度提升。

X AI KOLs Following

MiniMax 宣布推出 MiniMax-M3，这是一款结合前沿编程和代理能力的开源权重模型，采用稀疏注意力机制扩展至 1M 上下文，计划于下周在 HuggingFace 上线。