@Modular:我们的内核团队整周都在深入研究 MiniMax M3。百万token上下文和原生多模态让它的服务模式变得困难……
摘要
Modular 的内核团队正在优化对 MiniMax M3 的百万token上下文和原生多模态的服务,开放权重即将发布,可立即在 Modular 上部署。
我们的内核团队整周都在深入研究 MiniMax M3。百万token上下文和原生多模态让它成为一个难以良好服务的模型,而这正是我们喜欢的那种挑战!
当开放权重在未来几天内发布时,您将能够立即在 Modular 上运行它。
敬请关注 @MiniMax_AI x Modular。
查看缓存全文
缓存时间: 2026/06/10 00:20
我们的内核团队整个星期都在深入钻研 MiniMax M3。100 万 token 的上下文长度和原生多模态能力使得这个模型难以很好地服务,而这正是我们喜欢的那种挑战!
当开源权重在未来几天发布后,您将能够立即在 Modular 上运行它。
敬请关注 @MiniMax_AI 与 Modular 的后续动态。
相似文章
MiniMax 承诺在发布百万上下文模型后公开 M3 权重(2 分钟阅读)
MiniMax 通过 API 发布了 M3,这是一款拥有 100 万 token 上下文窗口并支持原生多模态输入的模型。该公司承诺在 10 天内发布开源权重和技术报告。
MiniMax M3(2分钟阅读)
MiniMax 推出了 M3,这是首个结合编程、智能体与多模态能力的开源权重模型,通过稀疏注意力机制支持高达 100 万 token 的上下文。
@PrajwalTomar_: 大家又在忽视MiniMax了。他们刚刚发布了M3。首个结合前沿编码、1…
MiniMax发布了M3,一个开放权重模型,结合了前沿编码、1M上下文和原生多模态能力,性能与Opus相当,但成本仅为其一小部分。
MiniMax 预告即将推出的 M3 模型:全新稀疏注意力机制,长上下文响应速度提升 15.6 倍(12 分钟阅读)
MiniMax 发布了关于其 M2 系列的详细技术报告,并预告了即将推出的 M3 模型。该模型采用一种新颖的稀疏注意力机制,在百万 token 上下文中实现高达 15.6 倍的解码速度提升。
@RyanLeeMiniMax: MiniMax-M3 将于下周在 HuggingFace 上以开源权重形式发布!
MiniMax 宣布推出 MiniMax-M3,这是一款结合前沿编程和代理能力的开源权重模型,采用稀疏注意力机制扩展至 1M 上下文,计划于下周在 HuggingFace 上线。