@rasbt:又一个开源权重发布。Nemotron 3 Ultra 拥有令人印象深刻的性能效率比!在设计上,它……

X AI KOLs Timeline 模型

摘要

Nemotron 3 Ultra 是一个开源权重发布,具有令人印象深刻的性能效率比,采用 Mamba-2 与注意力机制的混合栈和 LatentMoE,并且比之前的 Super 变体更大。

又一个开源权重发布。Nemotron 3 Ultra 拥有令人印象深刻的性能效率比! 在设计上,它延续了之前 Super 变体引入的 Mamba-2 与注意力机制的混合栈和 LatentMoE。但各方面都有所扩大。 https://t.co/nRjbMtY2aI
查看原文
查看缓存全文

缓存时间: 2026/06/05 07:09

另一个开源权重发布!Nemotron 3 Ultra 的能力效率比非常惊人!

设计上,它延续了前代 Super 变体中的 Mamba-2-attention 混合堆叠和 LatentMoE。但各个方面都更大了一些。https://t.co/nRjbMtY2aI

Sebastian Raschka (@rasbt): 有段时间没见了!开源权重的消费级硬件本地 LLM 生态又新增了 4 个不错的成员:

相似文章

NVIDIA Nemotron 3 Ultra 已发布。

Reddit r/LocalLLaMA

NVIDIA 发布了 Nemotron 3 Ultra,这是一款新模型,旨在为长期运行的 AI 智能体提供更快、更高效的推理能力。

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Hugging Face Models Trending

NVIDIA 发布 Nemotron-3-Ultra,一个拥有 5500 亿参数的开源权重模型,采用结合 Mamba-2、MoE 和注意力的混合架构,支持高达 100 万 token 的上下文长度和可配置的推理模式。