标签
作者声称Nemotron 3 Ultra比GPT 5.5更智能。
这条推文比较了Nemotron 3 Ultra和DeepSeek V4的后训练方法,指出两者都使用多个专长教师并通过在线策略蒸馏合并到一个学生模型,但在支持重叠方面存在差异。
使用Strix Halo硬件对四个大型语言模型(≤120B参数)在深度上下文性能上的比较。与GPT-OSS和Qwen模型相比,Nemotron Super在深度上下文中的提示处理速度表现出色。
Nous Research 和 NVIDIA 分别独立地走向了相同的架构——持久化 AI 代理,这些代理驻留在服务器上并每日进化,标志着从编码副驾驶向自主服务器端代理的转变。
NVIDIA发布了Nemotron仓库,其中包含开放的训练配方、流水线和模型权重,用于他们的Nemotron模型,包括新的Nemotron 3 Ultra和Nemotron 3 Nano Omni,支持智能体AI和多模态能力。
作者批评 Frontier AI(GPT5.5 xHigh)错误地建议对一个能单 GPU 容纳的模型使用张量并行,并宣布计划进行一场对决,比较多个 AI 模型(GPT5.5、Opus 4.8、Qwen 系列、Nemotron)在真实问题上的表现。
一位用户分享道,NVIDIA 目前正在免费提供顶级 AI 模型,如 Nemotron Ultra、DS4flash、Kimi、GLM 和 Minimax3,但有速率限制,可能对个人用户有益。
四种前沿AI模型(Nemotron 3 Ultra、DeepSeek V4、MiniMax M3、Qwen 3.7 Max)在相同两个提示词上的对比,附完整结果链接。
Nvidia的Nemotron系列AI模型完全开源,包含基准测试、GitHub仓库、数据和权重,性能上与NVFP4基准测试仅差1%。
Nemotron 3 Ultra 是一个开源权重发布,具有令人印象深刻的性能效率比,采用 Mamba-2 与注意力机制的混合栈和 LatentMoE,并且比之前的 Super 变体更大。
NVIDIA 发布了 Nemotron 3 Ultra,这是一款新模型,旨在为长期运行的 AI 智能体提供更快、更高效的推理能力。
NVIDIA 发布了 Nemotron 3.5 ASR,这是一款开源的多语言语音转文字模型,在测试中延迟最低,提供多语言和纯英文两个版本,非常适合语音助手和自托管部署场景。
NVIDIA发布了Nemotron Ultra,这是一个拥有55B/550B参数的混合MoE模型,具有百万上下文窗口,支持MTP推测解码,并在transformers中提供day-0支持。
NVIDIA 发布 Nemotron-3-Ultra,一个拥有 5500 亿参数的开源权重模型,采用结合 Mamba-2、MoE 和注意力的混合架构,支持高达 100 万 token 的上下文长度和可配置的推理模式。
Jensen Huang暗示将发布更多Nemotron模型,强调通过NVFP4训练实现的开源前沿智能和成本效益。
NVIDIA 推出 MCG 工具包,这是一个自动化流水线,能在不到一分钟内根据源代码生成合规的模型文档(Model Card++ 格式),并利用 RAG 和 NIM 微服务。
使用Qwen 0.6B为Nemotron-Personas数据集预计算的嵌入向量,通过网页演示实现对合成角色进行语义搜索和聚类。
NVIDIA推出Nemotron-Labs Diffusion,这是一系列扩散语言模型,可并行生成文本并迭代优化,从而提供更快的生成速度并支持修订之前的令牌。