标签
Nemotron 3 Ultra 是一个开源权重发布,具有令人印象深刻的性能效率比,采用 Mamba-2 与注意力机制的混合栈和 LatentMoE,并且比之前的 Super 变体更大。
Ideogram 4 是一个从零开始训练的开放权重的文生图模型,支持结构化 JSON 提示、业界最佳的多语言文本渲染、边界框布局控制、调色板控制以及原生 2K 分辨率输出。
Sebastian Raschka 介绍了近期可在消费级硬件上运行的开源权重本地大语言模型生态系统的四项新增内容。
MiniMax 通过 API 发布了 M3,这是一款拥有 100 万 token 上下文窗口并支持原生多模态输入的模型。该公司承诺在 10 天内发布开源权重和技术报告。
JetBrains 发布 Mellum 2,这是一个 12B 参数的开源权重混合专家语言模型,专注于软件工程领域,在代码生成、推理和工具使用方面性能具有竞争力,基于 Apache 2.0 许可证发布。
Luke J. Huang 的新博客文章调研了异步强化学习理论与基础设施,涵盖 8 家开放权重前沿实验室,并讨论了算法技术以及针对训练-推理不匹配的系统修复方案。
MiniMax 发布了 M3,这是一个开源权重模型,具备前沿编码能力、智能体能力、百万级上下文和原生多模态能力,在编码和智能体任务上取得了顶级基准成绩,并支持自主任务分解和长上下文。
Miles Brundage 评论说,关于蒸馏如何影响开源权重与专有AI模型之间的能力差距,目前缺乏定量分析,并引用了Epoch AI的说法,即开源权重模型落后四个月。
Epoch AI Research 分析了开源权重模型与专有模型之间的能力差距,发现自年初以来,开源权重模型一直比最先进水平落后约四个月。
Mellum 2 是一个由 JetBrains 开发的 12B 参数开源权重的 MoE 语言模型,具有 2.5B 活跃参数,专注于软件工程任务,并针对商用 GPU 上的高效推理进行了优化。
Numind发布了NuExtract3,这是一个基于Qwen3.5-4B的4B开放权重视觉语言模型,专为将文档图像转换为Markdown、OCR和结构化数据提取而设计。该模型采用Apache-2.0许可证,可自行托管,并提供量化版本以适应低显存环境。
Stability AI发布了Stable Audio 3.0,这是一个开放权重模型系列,可生成最长六分钟的变长音频,支持LoRA微调和音频修复,基于完全许可的数据训练。
Stability AI 发布了 Stable Audio 3.0,这是一个用于生成音频的开放权重模型系列,旨在支持艺术实验并集成到 gary4juce 等 DAW 中。
MiroThinker-1.7 是一款基于 Qwen3 MoE 构建的开放权重深度研究代理,其迷你版(总计30B参数,激活3B参数)专为消费级硬件设计;团队分享了基准测试结果,并寻求关于本地部署的反馈。
Infinity 发布了两个开源权重模型,Infinity-Parser2-Pro(35B)和 Infinity-Parser2-Flash(2B),它们登顶了 ParseBench 文档理解排行榜,利用了合成数据引擎和一种新颖的联合强化学习算法。
Santiago (@svpino) 强调 MiniMax-M2.7,一个 230B 参数的开源权重模型,能与 Opus 4.6 和 GPT-5.4 等顶级专有模型相抗衡,在 SambaNova 上以低成本实现 440+ tokens/s 的推理速度。
Poolside 正在伦敦举办为期两天的模型研究黑客松,旨在利用强化学习和在 Laguna XS.2 上的微调,进一步推动开源权重智能体模型的发展。合作伙伴包括 NVIDIA、Prime Intellect 和 Hugging Face,奖品为 NVIDIA DGX Spark。
Hebatron 是一款基于 NVIDIA Nemotron-3 混合专家(MoE)架构构建的、专攻希伯来语的新开源权重大型语言模型。该模型在实现高效推理的同时展现出强大的推理能力。它是首个针对该架构进行的语言特定适配版本,并支持原生长上下文处理。