@rasbt：又一个开源权重发布。Nemotron 3 Ultra 拥有令人印象深刻的性能效率比！在设计上，它……

X AI KOLs Timeline 2026/06/04 16:41 模型

open-weight nemotron mamba moe llm local-llm

摘要

Nemotron 3 Ultra 是一个开源权重发布，具有令人印象深刻的性能效率比，采用 Mamba-2 与注意力机制的混合栈和 LatentMoE，并且比之前的 Super 变体更大。

又一个开源权重发布。Nemotron 3 Ultra 拥有令人印象深刻的性能效率比！在设计上，它延续了之前 Super 变体引入的 Mamba-2 与注意力机制的混合栈和 LatentMoE。但各方面都有所扩大。 https://t.co/nRjbMtY2aI

查看原文

查看缓存全文

缓存时间: 2026/06/05 07:09

另一个开源权重发布！Nemotron 3 Ultra 的能力效率比非常惊人！

设计上，它延续了前代 Super 变体中的 Mamba-2-attention 混合堆叠和 LatentMoE。但各个方面都更大了一些。https://t.co/nRjbMtY2aI

Sebastian Raschka (@rasbt): 有段时间没见了！开源权重的消费级硬件本地 LLM 生态又新增了 4 个不错的成员：

相似文章

Reddit r/LocalLLaMA

NVIDIA 发布了 Nemotron 3 Ultra，这是一款新模型，旨在为长期运行的 AI 智能体提供更快、更高效的推理能力。

Hugging Face Daily Papers

Nemotron 3 Ultra 是一个550B参数的混合Mamba-Attention专家混合语言模型，在20T tokens上预训练，扩展至1M上下文，并通过SFT、RL和MOPD进行后训练。相比同等精度的一流LLM，其推理吞吐量最高可提升6倍，并已开源。

X AI KOLs Following

NVIDIA 宣布推出 Nemotron 3 Super（120B）和 Nemotron 3 Ultra（约500B）模型，这些模型在 NVFP4 精度下基于25T tokens进行了预训练，强调加速计算和效率提升。

X AI KOLs Following

作者将Nemotron 3 Ultra列为五大开源AI模型之一，称其为消费者带来前沿智能。

Hugging Face Models Trending

NVIDIA 发布 Nemotron-3-Ultra，一个拥有 5500 亿参数的开源权重模型，采用结合 Mamba-2、MoE 和注意力的混合架构，支持高达 100 万 token 的上下文长度和可配置的推理模式。