@mervenoyann: NVIDIA Nemotron Ultra 来了 > 55B/550B 混合MoE  百万上下文窗口 > 支持MTP推测解码 > da…

X AI KOLs Following 模型

摘要

NVIDIA发布了Nemotron Ultra,这是一个拥有55B/550B参数的混合MoE模型,具有百万上下文窗口,支持MTP推测解码,并在transformers中提供day-0支持。

NVIDIA Nemotron Ultra 来了 😍 > 55B/550B 混合MoE  🦖 百万上下文窗口 > 支持MTP推测解码 💨 > 在transformers中支持day-0 位于AA Index中性能/效率最具吸引力的象限 🔥 https://t.co/MGsP3DqEcd
查看原文
查看缓存全文

缓存时间: 2026/06/05 05:10

NVIDIA Nemotron Ultra 来了 😍

55B/550B 混合 MoE 模型 🦖,拥有 1M 上下文窗口 支持 MTP 推测解码 💨 在 transformers 中首日即支持

在 AA Index 的性能/效率象限中处于最具吸引力的位置 🔥 https://t.co/MGsP3DqEcd

相似文章

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face

Reddit r/LocalLLaMA

NVIDIA发布Nemotron-3-Ultra-550B-A55B,这是一个5500亿参数(550亿活跃参数)的前沿大语言模型,采用混合LatentMoE架构,结合Mamba-2、MoE和注意力层,支持高达100万令牌的上下文长度和可配置的推理模式。它支持11种语言,并针对复杂的智能体工作流、长上下文分析和高精度推理进行了优化。

NVIDIA Nemotron 3 Ultra 已发布。

Reddit r/LocalLLaMA

NVIDIA 发布了 Nemotron 3 Ultra,这是一款新模型,旨在为长期运行的 AI 智能体提供更快、更高效的推理能力。