@mervenoyann: NVIDIA Nemotron Ultra 来了 > 55B/550B 混合MoE 百万上下文窗口 > 支持MTP推测解码 > da…

X AI KOLs Following 2026/06/04 13:25 模型

摘要

NVIDIA发布了Nemotron Ultra，这是一个拥有55B/550B参数的混合MoE模型，具有百万上下文窗口，支持MTP推测解码，并在transformers中提供day-0支持。

NVIDIA Nemotron Ultra 来了 😍 > 55B/550B 混合MoE 🦖 百万上下文窗口 > 支持MTP推测解码 💨 > 在transformers中支持day-0 位于AA Index中性能/效率最具吸引力的象限 🔥 https://t.co/MGsP3DqEcd

查看原文

查看缓存全文

缓存时间: 2026/06/05 05:10

NVIDIA Nemotron Ultra 来了 😍

55B/550B 混合 MoE 模型 🦖，拥有 1M 上下文窗口支持 MTP 推测解码 💨 在 transformers 中首日即支持

在 AA Index 的性能/效率象限中处于最具吸引力的位置 🔥 https://t.co/MGsP3DqEcd

相似文章

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face

Reddit r/LocalLLaMA

NVIDIA发布Nemotron-3-Ultra-550B-A55B，这是一个5500亿参数（550亿活跃参数）的前沿大语言模型，采用混合LatentMoE架构，结合Mamba-2、MoE和注意力层，支持高达100万令牌的上下文长度和可配置的推理模式。它支持11种语言，并针对复杂的智能体工作流、长上下文分析和高精度推理进行了优化。