Mellum2 开源：一款适用于 AI 工作流的快速模型 | JetBrains AI 博客

Reddit r/LocalLLaMA 2026/06/01 14:00 模型

open-source moe software-engineering jetbrains model-release ai-workflows

摘要

JetBrains 将 Mellum2 开源，这是一个快速的 12B 混合专家模型，专为软件工程中的低延迟 AI 工作流设计，遵循 Apache 2.0 许可证。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/01 15:45

# Mellum2 正式开源：专为 AI 工作流打造的快速模型 | JetBrains AI 博客来源：https://blog.jetbrains.com/ai/2026/06/mellum2-goes-open-source-a-fast-model-for-ai-workflows/ Ai 标志 (https://blog.jetbrains.com/ai/)让您的工具借助 JetBrains 众多产品内的 AI 功能如虎添翼新闻 (https://blog.jetbrains.com/ai/category/news/) 发布 (https://blog.jetbrains.com/ai/category/releases/) ## Mellum2 正式开源：专为 AI 工作流打造的快速模型 Anton Semenkin Nikita Pavlichenko **从头训练，专为实际部署设计，Mellum2 能够胜任路由、问答、子代理以及软件工程系统中的私有 AI 场景。** 今天，我们正式开源 Mellum2——一个 12B 参数的模型，专为解决生产级 AI 最棘手的难题而设计：延迟、吞吐量和成本。Mellum2 从头构建，基于 Apache 2.0 许可证发布，为您的基础设施提供高性能、高性价比的替代方案。 Mellum 始于代码补全 (https://blog.jetbrains.com/ai/2025/04/mellum-goes-open-source-a-purpose-built-llm-for-developers-now-on-hugging-face/)；如今我们已经将其演进为同时处理自然语言和代码的模型。现在它是一款多功能工具，能够在您的现代 AI 工作流中胜任路由、摘要和中间推理步骤。无论您是想实验、微调还是大规模部署，Mellum2 都已准备好运行在您自己的系统中。尝试 Mellum (https://huggingface.co/collections/JetBrains/mellum-2) ## 架构与性能 Mellum2 通过其架构和专注、效率驱动的设计，解决了生产级系统的瓶颈问题。 - **混合专家 (MoE) 架构：** 模型总参数量为 12B，但由于采用 MoE 设计，每个 token 仅激活 2.5B 参数。这降低了计算成本，同时为实时工作负载实现了高吞吐、低延迟的推理。 - **专精领域：** 与许多现代模型不同，Mellum2 并非多模态模型。它专门针对自然语言和代码数据进行训练。这种专精确保了模型在软件工程环境中表现出色，同时保持轻量和快速。我们在技术报告 (https://arxiv.org/abs/2605.31268) 中详细介绍了模型在代码生成、科学、数学和推理基准测试中的表现。Mellum2 与其他类似规模模型相比具有竞争力，同时将推理时间缩短一半以上——这对于生产级部署来说是一个决定性优势。 ## Mellum2 的主要用例 - **路由与编排 AI 工作负载：** 使用 Mellum2 分析传入提示，帮助为每个任务选择合适的模型或工具。 - **构建低延迟的 RAG 管道：** 检索相关上下文，使用 Mellum2 进行摘要，并即时生成响应。 - **为复杂工作流中的快速子代理提供动力：** 将代理管道分解为上下文收集、规划和验证等步骤。使用 Mellum2 处理快速、专门的任务，而不是依赖单个大模型。 - **实现私密、本地的 AI 部署：** 在本地运行 Mellum2 或自行托管，确保代码和数据完全受您控制。 ## "焦点模型"哲学：为什么专注的模型扩展性更好随着 AI 系统变得越来越复杂，性能瓶颈从原始能力转向了延迟、吞吐量和规模化成本。并非每个任务都需要最大的模型。现代 AI 系统中的许多步骤是重复性的、对延迟敏感且高频率的。这些步骤受益于一个快速且可靠的模型，该模型可以高效地进行路由、托管和控制。在 JetBrains，我们相信未来属于协调的系统，而非单一模型。前沿模型将继续突破极限，但实用的 AI 产品同样需要焦点模型：快速、专门的组件，能够高效处理高频任务。这就是我们看到的 Mellum2 在下一代 AI 软件工具中的角色。 ## 立即开始使用 Mellum2 如果您正在构建用于软件工程的 AI 系统——无论是在 IDE 内、RAG 管道中、作为代理工作流的一部分，还是完全在您自己的基础设施上——我们非常希望您尝试 Mellum2。开源让更好的工具得以诞生。尝试 Mellum (https://huggingface.co/collections/JetBrains/mellum-2) #### 订阅 JetBrains AI 博客更新 https://blog.jetbrains.com/ai/2026/06/mellum2-goes-open-source-a-fast-model-for-ai-workflows/# ## 发现更多

Mellum2 开源：一款适用于 AI 工作流的快速模型 | JetBrains AI 博客

相似文章

JetBrains 的 Mellum 2（阅读时间 49 分钟）

JetBrains 推出 Mellum2：一款面向代码生成与推理任务的 12B 参数混合专家模型

Mellum2 技术报告

Mellum by JetBrains

JetBrains/Mellum2-12B-A2.5B-Thinking

提交意见反馈