@rasbt:又一个开源权重发布。Nemotron 3 Ultra 拥有令人印象深刻的性能效率比!在设计上,它……
摘要
Nemotron 3 Ultra 是一个开源权重发布,具有令人印象深刻的性能效率比,采用 Mamba-2 与注意力机制的混合栈和 LatentMoE,并且比之前的 Super 变体更大。
查看缓存全文
缓存时间: 2026/06/05 07:09
另一个开源权重发布!Nemotron 3 Ultra 的能力效率比非常惊人!
设计上,它延续了前代 Super 变体中的 Mamba-2-attention 混合堆叠和 LatentMoE。但各个方面都更大了一些。https://t.co/nRjbMtY2aI
Sebastian Raschka (@rasbt): 有段时间没见了!开源权重的消费级硬件本地 LLM 生态又新增了 4 个不错的成员:
相似文章
NVIDIA Nemotron 3 Ultra 已发布。
NVIDIA 发布了 Nemotron 3 Ultra,这是一款新模型,旨在为长期运行的 AI 智能体提供更快、更高效的推理能力。
Nemotron 3 Ultra:用于智能体推理的高效开源混合专家Mamba-Transformer模型
Nemotron 3 Ultra 是一个550B参数的混合Mamba-Attention专家混合语言模型,在20T tokens上预训练,扩展至1M上下文,并通过SFT、RL和MOPD进行后训练。相比同等精度的一流LLM,其推理吞吐量最高可提升6倍,并已开源。
@ctnzr: 我们更进一步:Nemotron 3 Super 拥有120B参数,在NVFP4精度下基于25T tokens进行了预训练。Nemotron 3 Ultra 大约为500B参数,……
NVIDIA 宣布推出 Nemotron 3 Super(120B)和 Nemotron 3 Ultra(约500B)模型,这些模型在 NVFP4 精度下基于25T tokens进行了预训练,强调加速计算和效率提升。
@TheAhmadOsman: 我现在将Nemotron 3 Ultra列为五大开源模型之一——前沿智能到家
作者将Nemotron 3 Ultra列为五大开源AI模型之一,称其为消费者带来前沿智能。
nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
NVIDIA 发布 Nemotron-3-Ultra,一个拥有 5500 亿参数的开源权重模型,采用结合 Mamba-2、MoE 和注意力的混合架构,支持高达 100 万 token 的上下文长度和可配置的推理模式。