MiniMax M3 - 编码与智能体前沿，百万级上下文，多模态

Reddit r/LocalLLaMA 2026/06/01 01:23 模型

open-weight coding agentic multimodal 1m-context sparse-attention

摘要

MiniMax 发布了 M3，这是一个开源权重模型，具备前沿编码能力、智能体能力、百万级上下文和原生多模态能力，在编码和智能体任务上取得了顶级基准成绩，并支持自主任务分解和长上下文。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/01 01:37

# MiniMax M3 - 编码与智能体前沿，百万上下文，多模态来源：https://www.minimax.io/models/text/m3 编码与智能体前沿。百万上下文的MSA。原生多模态。首个同时具备三大前沿能力的开源权重模型。 ### 性能基准 M3在编码和智能体基准测试中达到顶级水平，具备自主任务分解、工具调用和多步推理能力，为AI编码助手和自动化工作流提供了可靠基础。基于专有的MiniMax稀疏注意力（MSA）架构，M3 API支持最高100万个token的上下文窗口，并保证至少51.2万个token。百万上下文是长程智能体任务、长程编码和长视频理解的基础设施。原生多模态模型。整个数据管道已重建，将预训练数据扩展到100万亿以上，从第零步开始进行多模态训练，实现了文本与视觉语义空间的深度对齐。多模态是原生核心能力，而非肤浅的附加功能。在BrowseComp上，M3得分为83.5，超越Opus 4.7（79.3），展现了强大的自主浏览和信息检索能力。直到现在，只有少数闭源模型能够同时实现前沿编码能力、百万token上下文和多模态。M3是首个将完整前沿能力带入开源世界的模型。论文复现：12小时自主ICLR论文复现 ### 论文复现：12小时自主ICLR论文复现我们要求M3独立复现一篇ICLR 2025杰出论文——《LLM微调的学习动态》。M3连续运行近12小时，独立生成18次提交和23张实验图表，成功复现了核心实验。多模态能力解析了论文中的图表和公式，长上下文将论文、代码和实验日志整合到一个窗口中，编码和智能体能力驱动了长周期执行。 ### CUDA内核优化：147次迭代，9.4倍加速 FP8 GEMM是LLM推理中计算量最大、优化难度最高的操作之一。我们让M3在NVIDIA Hopper GPU上优化该内核，仅提供任务描述和一个不可执行的Triton框架。约24小时内，M3完成了147次基准提交和1959次工具调用，将硬件峰值利用率从7.6%提升至71.3%——实现了9.4倍加速，全程无需人工干预。 CUDA内核优化：147次迭代，9.4倍加速 PostTrainBench：M3自行训练模型 ### PostTrainBench：M3自行训练模型我们向M3提供了四个仅预训练的基座模型，要求其在12小时内自主完成完整流程——数据合成、训练、评估和迭代——使这些模型具备数学推理、代码生成和知识问答能力。整个过程无需人工干预。M3得分为37.1，排名总榜第三，仅次于Opus 4.7（42.4）和GPT-5.5（39.3），大幅领先其他所有模型。开发者工具 ## 赋能开发者选择出色的工具脚手架泛化能力 #### 01 / 访问方式 ### 快速API集成 API版本：M3，结果相同但速度更快。完全自动缓存支持，无需配置。 #### 02 / 访问方式 ### 用于AI编码工具 01 / 订阅Token方案价格不变，性能显著提升。Token方案用户现在自动受益于M3增强的编码和推理能力。了解更多 (https://platform.minimax.io/subscribe/token-plan) 02 / 开放平台集成支持标准M3，最高100万token的上下文窗口。了解更多 (https://platform.minimax.io/docs/guides/text-generation) 03 / MiniMax Code集成基于M3的通用Agent平台现已全面开放。无需任何开发即可体验编码智能体、多模态理解等旗舰能力。了解更多 (https://code.minimax.io/) 04 / 开源与本地部署我们致力于回馈社区。M3即将在HuggingFace和GitHub上完全开源，支持私有集群部署和微调。了解更多 (https://huggingface.co/MiniMaxAI)

MiniMax M3 - 编码与智能体前沿，百万级上下文，多模态

相似文章

Claude 5 Opus 与 3D 月光场景

你们难道不害怕我们正在走向何方吗？一年前，GPT-5 被认为是世界上最好的模型之一。如今，像 Qwen3.6-27B 这样的开源权重模型已经足够有竞争力，可以在高端消费级硬件上本地运行。进步的速度简直令人震惊。

我们测试了WBS驱动的多智能体编码；前景可观，但编排者必须懂得何时隐退

VLD-RAG：面向长篇幅、视觉丰富多页文档的智能视觉语言检索增强生成

多轮多模态诊断推理在具有挑战性的真实临床案例上的评估

提交意见反馈