标签
由于美国出口限制,英伟达的AI芯片在中国以创纪录的高价销售,同时该公司还宣布推出新的液冷系统以减少数据中心用水量。
本文探讨了人工智能相关科技股出现的抛售潮,引发人们质疑对人工智能的巨额投入是否能够带来回报。文章强调市场波动性,指出美光、英伟达、Alphabet等主要公司股价大幅下跌。
NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例,以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能,使企业能够以更优的性能和更低的运营复杂性,大规模部署AI应用。
NVIDIA 宣布推出 DFlash,一种用于推测解码的开源块扩散模型,在 Blackwell GPU 上可实现高达 15 倍的推理吞吐量提升,同时保持交互性。
NVIDIA的新芯片使得在本地运行500B参数的模型成为可能,凸显出AI安全措施仅仅是行为上的减速带,离线即消失,为大规模欺骗和操纵带来了前所未有的风险。
英伟达悄然收购了Essential AI的团队,包括Transformer论文合著者Ashish Vaswani,他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。
NVIDIA推出了BioNeMo Agent Toolkit,这是一个开放的工具包,使AI代理能够执行蛋白质结构预测、分子对接和生成化学等任务,与Arc Institute合作加速可编程生物学。
分析主要AI实验室的招聘数据以推断其战略方向,指出xAI专注于科学辅导员,Nvidia推动数据中心,OpenAI工程团队增长。
面向16GB显存NVIDIA GPU优化的新型Qwen3.6-27B GGUF量化版本,包含实验性Trellis变体,并附带了困惑度基准测试。
Spark Doctor 是一个开源的诊断命令行工具,专为NVIDIA DGX Spark设计,可收集系统、GPU、内存、Docker和配方数据,应用特定规则,并输出常见问题的可能原因及后续步骤。
SGLang 为 DeepSeek-V4 提供了首日支持,LMSys 与 NVIDIA 工程团队的合作在生产环境中实现了高达 5 倍的吞吐量提升,相关改进已在 SemiAnalysis InferenceX 仪表盘上展示。
NVIDIA 推出 Agent Toolkit,这是一个开放的模块化基础架构,包含模型、工具、技能和安全运行时,帮助企业为各行各业构建专用、可信的AI智能体。
Valve正在与Intel和Nvidia合作,将SteamOS支持扩展到更多GPU和手持设备,包括为Intel手持设备提供初始固件,以及为Nvidia持续进行驱动开发。
NVIDIA 悄然发布了 Nemotron-3.5-ASR,这是一个轻量级、参数规模为 0.6B 的开源语音识别模型,专为实时流式传输设计,支持 40 多种语言、低延迟和缓存感知架构。
NVIDIA技术现已为全球500强最快超级计算机中的400多台提供动力(占TOP500的81%),GPU和网络采用率创下纪录,并在Green500榜单上获得最高效率。
NVIDIA 在 DTW Ignite 2026 上发布了面向电信运营的新 AI 代理和工具,包括合成数据生成和安全代理运行时。该平台旨在通过结合领域特定模型、隐私安全的合成数据和基于策略的护栏,实现自主网络。
讨论使用NVFP4 4位浮点权重以获得最大性能,通过使用NVIDIA ModelOpt从FP8进行内部量化实现,突出了该数据格式的双缩放因子以保持高动态范围。
Baseten 宣布推出针对 GLM-5.2 开源模型的世界最快 API,通过 NVFP4 量化、分离式推理等优化,实现每秒超过 280 个 token 的处理速度。
SpaceX与开源AI初创公司Reflection签署了一项价值高达63亿美元的算力协议,允许Reflection通过SpaceX的Colossus数据中心使用Nvidia GB300s。这笔交易凸显了SpaceX向出售计算能力领域的扩张以及开源AI日益增长的势头。