Mellum2 开源:一款适用于 AI 工作流的快速模型 | JetBrains AI 博客

Reddit r/LocalLLaMA 模型

摘要

JetBrains 将 Mellum2 开源,这是一个快速的 12B 混合专家模型,专为软件工程中的低延迟 AI 工作流设计,遵循 Apache 2.0 许可证。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/01 15:45

# Mellum2 正式开源:专为 AI 工作流打造的快速模型 | JetBrains AI 博客 来源:https://blog.jetbrains.com/ai/2026/06/mellum2-goes-open-source-a-fast-model-for-ai-workflows/ Ai 标志 (https://blog.jetbrains.com/ai/)让您的工具借助 JetBrains 众多产品内的 AI 功能如虎添翼 新闻 (https://blog.jetbrains.com/ai/category/news/) 发布 (https://blog.jetbrains.com/ai/category/releases/) ## Mellum2 正式开源:专为 AI 工作流打造的快速模型 Anton Semenkin Nikita Pavlichenko **从头训练,专为实际部署设计,Mellum2 能够胜任路由、问答、子代理以及软件工程系统中的私有 AI 场景。** 今天,我们正式开源 Mellum2——一个 12B 参数的模型,专为解决生产级 AI 最棘手的难题而设计:延迟、吞吐量和成本。Mellum2 从头构建,基于 Apache 2.0 许可证发布,为您的基础设施提供高性能、高性价比的替代方案。 Mellum 始于代码补全 (https://blog.jetbrains.com/ai/2025/04/mellum-goes-open-source-a-purpose-built-llm-for-developers-now-on-hugging-face/);如今我们已经将其演进为同时处理自然语言和代码的模型。现在它是一款多功能工具,能够在您的现代 AI 工作流中胜任路由、摘要和中间推理步骤。 无论您是想实验、微调还是大规模部署,Mellum2 都已准备好运行在您自己的系统中。 尝试 Mellum (https://huggingface.co/collections/JetBrains/mellum-2) ## 架构与性能 Mellum2 通过其架构和专注、效率驱动的设计,解决了生产级系统的瓶颈问题。 - **混合专家 (MoE) 架构:** 模型总参数量为 12B,但由于采用 MoE 设计,每个 token 仅激活 2.5B 参数。这降低了计算成本,同时为实时工作负载实现了高吞吐、低延迟的推理。 - **专精领域:** 与许多现代模型不同,Mellum2 并非多模态模型。它专门针对自然语言和代码数据进行训练。这种专精确保了模型在软件工程环境中表现出色,同时保持轻量和快速。 我们在技术报告 (https://arxiv.org/abs/2605.31268) 中详细介绍了模型在代码生成、科学、数学和推理基准测试中的表现。Mellum2 与其他类似规模模型相比具有竞争力,同时将推理时间缩短一半以上——这对于生产级部署来说是一个决定性优势。 ## Mellum2 的主要用例 - **路由与编排 AI 工作负载:** 使用 Mellum2 分析传入提示,帮助为每个任务选择合适的模型或工具。 - **构建低延迟的 RAG 管道:** 检索相关上下文,使用 Mellum2 进行摘要,并即时生成响应。 - **为复杂工作流中的快速子代理提供动力:** 将代理管道分解为上下文收集、规划和验证等步骤。使用 Mellum2 处理快速、专门的任务,而不是依赖单个大模型。 - **实现私密、本地的 AI 部署:** 在本地运行 Mellum2 或自行托管,确保代码和数据完全受您控制。 ## "焦点模型"哲学:为什么专注的模型扩展性更好 随着 AI 系统变得越来越复杂,性能瓶颈从原始能力转向了延迟、吞吐量和规模化成本。并非每个任务都需要最大的模型。现代 AI 系统中的许多步骤是重复性的、对延迟敏感且高频率的。这些步骤受益于一个快速且可靠的模型,该模型可以高效地进行路由、托管和控制。 在 JetBrains,我们相信未来属于协调的系统,而非单一模型。前沿模型将继续突破极限,但实用的 AI 产品同样需要焦点模型:快速、专门的组件,能够高效处理高频任务。 这就是我们看到的 Mellum2 在下一代 AI 软件工具中的角色。 ## 立即开始使用 Mellum2 如果您正在构建用于软件工程的 AI 系统——无论是在 IDE 内、RAG 管道中、作为代理工作流的一部分,还是完全在您自己的基础设施上——我们非常希望您尝试 Mellum2。 开源让更好的工具得以诞生。 尝试 Mellum (https://huggingface.co/collections/JetBrains/mellum-2) #### 订阅 JetBrains AI 博客更新 https://blog.jetbrains.com/ai/2026/06/mellum2-goes-open-source-a-fast-model-for-ai-workflows/# ## 发现更多

相似文章

JetBrains 的 Mellum 2(阅读时间 49 分钟)

TLDR AI

JetBrains 发布 Mellum 2,这是一个 12B 参数的开源权重混合专家语言模型,专注于软件工程领域,在代码生成、推理和工具使用方面性能具有竞争力,基于 Apache 2.0 许可证发布。

Mellum2 技术报告

Hugging Face Daily Papers

Mellum 2 是一个由 JetBrains 开发的 12B 参数开源权重的 MoE 语言模型,具有 2.5B 活跃参数,专注于软件工程任务,并针对商用 GPU 上的高效推理进行了优化。

JetBrains/Mellum2-12B-A2.5B-Thinking

Hugging Face Models Trending

JetBrains releases Mellum2-12B-A2.5B-Thinking, an open-source Mixture-of-Experts reasoning model with 131k context length, trained with RLVR for explicit chain-of-thought reasoning.

Mellum 2 12B A2.5B

Reddit r/LocalLLaMA

JetBrains发布了Mellum 2 12B A2.5B,这是一个专注于编码的小型MoE模型,其推理性能与Qwen 3.5 9B相当,但在其他任务上较弱。