标签
SOLAR是一个框架,它利用LLM前端和确定性分析,从PyTorch和JAX源代码自动推导经过验证的光速性能界限,从而为深度学习工作负载提供余量分析和优化洞察。
本文提出了Nemotron-TwoTower,一种扩散语言模型,通过冻结的自回归塔和可训练的扩散去噪器解耦上下文表示与去噪过程,以2.42倍吞吐量达到了基线质量98.7%的水平。
Liquid AI 的 LFM2.5-230M 模型在 Unitree G1 机器人上展示了多步工具调用能力,完全在 NVIDIA Jetson Orin 设备端运行,充当技能选择层。
NVIDIA宣布在Steam夏季促销期间推出GeForce NOW夏季折扣,并新增云游戏库游戏,强调云游戏的优势。
NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16,这是一种基于扩散的语言模型,采用逐块自回归扩散方法,通过对令牌块进行迭代去噪来生成文本,实现了自回归基线 2.42 倍的生成吞吐量,同时保留了基准测试质量 98.7% 的水平。
作者在4× DGX Spark (GB10)设备上成功运行了配备MTP投机解码的GLM-5.2,并揭示了公开构建配方中缺失的一个组件。
由于美国出口限制,英伟达的AI芯片在中国以创纪录的高价销售,同时该公司还宣布推出新的液冷系统以减少数据中心用水量。
本文探讨了人工智能相关科技股出现的抛售潮,引发人们质疑对人工智能的巨额投入是否能够带来回报。文章强调市场波动性,指出美光、英伟达、Alphabet等主要公司股价大幅下跌。
NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例,以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能,使企业能够以更优的性能和更低的运营复杂性,大规模部署AI应用。
NVIDIA 宣布推出 DFlash,一种用于推测解码的开源块扩散模型,在 Blackwell GPU 上可实现高达 15 倍的推理吞吐量提升,同时保持交互性。
NVIDIA的新芯片使得在本地运行500B参数的模型成为可能,凸显出AI安全措施仅仅是行为上的减速带,离线即消失,为大规模欺骗和操纵带来了前所未有的风险。
英伟达悄然收购了Essential AI的团队,包括Transformer论文合著者Ashish Vaswani,他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。
NVIDIA推出了BioNeMo Agent Toolkit,这是一个开放的工具包,使AI代理能够执行蛋白质结构预测、分子对接和生成化学等任务,与Arc Institute合作加速可编程生物学。
分析主要AI实验室的招聘数据以推断其战略方向,指出xAI专注于科学辅导员,Nvidia推动数据中心,OpenAI工程团队增长。
面向16GB显存NVIDIA GPU优化的新型Qwen3.6-27B GGUF量化版本,包含实验性Trellis变体,并附带了困惑度基准测试。
Spark Doctor 是一个开源的诊断命令行工具,专为NVIDIA DGX Spark设计,可收集系统、GPU、内存、Docker和配方数据,应用特定规则,并输出常见问题的可能原因及后续步骤。
SGLang 为 DeepSeek-V4 提供了首日支持,LMSys 与 NVIDIA 工程团队的合作在生产环境中实现了高达 5 倍的吞吐量提升,相关改进已在 SemiAnalysis InferenceX 仪表盘上展示。