@mervenoyann: NVIDIA Nemotron Ultra 来了 > 55B/550B 混合MoE  百万上下文窗口 > 支持MTP推测解码 > da…
摘要
NVIDIA发布了Nemotron Ultra,这是一个拥有55B/550B参数的混合MoE模型,具有百万上下文窗口,支持MTP推测解码,并在transformers中提供day-0支持。
查看缓存全文
缓存时间: 2026/06/05 05:10
NVIDIA Nemotron Ultra 来了 😍
55B/550B 混合 MoE 模型 🦖,拥有 1M 上下文窗口 支持 MTP 推测解码 💨 在 transformers 中首日即支持
在 AA Index 的性能/效率象限中处于最具吸引力的位置 🔥 https://t.co/MGsP3DqEcd
相似文章
nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face
NVIDIA发布Nemotron-3-Ultra-550B-A55B,这是一个5500亿参数(550亿活跃参数)的前沿大语言模型,采用混合LatentMoE架构,结合Mamba-2、MoE和注意力层,支持高达100万令牌的上下文长度和可配置的推理模式。它支持11种语言,并针对复杂的智能体工作流、长上下文分析和高精度推理进行了优化。
NVIDIA Nemotron 3 Ultra 已发布。
NVIDIA 发布了 Nemotron 3 Ultra,这是一款新模型,旨在为长期运行的 AI 智能体提供更快、更高效的推理能力。
Nemotron 3 Ultra。5500亿参数,550亿活跃参数,100万token上下文窗口
NVIDIA发布Nemotron 3 Ultra,一个庞大的5500亿参数混合专家模型,具有550亿活跃参数和100万token的上下文窗口。
@ctnzr: 我们更进一步:Nemotron 3 Super 拥有120B参数,在NVFP4精度下基于25T tokens进行了预训练。Nemotron 3 Ultra 大约为500B参数,……
NVIDIA 宣布推出 Nemotron 3 Super(120B)和 Nemotron 3 Ultra(约500B)模型,这些模型在 NVFP4 精度下基于25T tokens进行了预训练,强调加速计算和效率提升。
@MaximeRivest: NVIDIA 发布了 Nemotron 550B Ultra!它的工具调用和标准系统提示非常非常非常简洁,而且……
NVIDIA 发布了 Nemotron 550B Ultra,这是一个大型语言模型,采用简洁的基于 XML 的工具调用接口,而非 JSON 模式。工具结果以用户消息的形式嵌入 XML 标签中返回。