标签
讨论使用NVFP4 4位浮点权重以获得最大性能,通过使用NVIDIA ModelOpt从FP8进行内部量化实现,突出了该数据格式的双缩放因子以保持高动态范围。
Baseten 宣布推出针对 GLM-5.2 开源模型的世界最快 API,通过 NVFP4 量化、分离式推理等优化,实现每秒超过 280 个 token 的处理速度。
SpaceX与开源AI初创公司Reflection签署了一项价值高达63亿美元的算力协议,允许Reflection通过SpaceX的Colossus数据中心使用Nvidia GB300s。这笔交易凸显了SpaceX向出售计算能力领域的扩张以及开源AI日益增长的势头。
Nvidia声称其针对Rubin代的全新全液冷数据中心设计,通过提高服务器运行温度并使用液冷,可将用水量降至接近零。
NVIDIA 强调 Manhattan Institute 的一项统计:数据中心仅占美国每日用水量的0.2%,且由于新技术,这一数字近年来有所下降。
Groq融资6.5亿美元,在英伟达200亿美元的授权交易和人才挖角之后转向其neocloud业务,招聘新高管并扩展数据中心。
英伟达宣布推出一种温水冷却系统,可显著降低数据中心现场用水量,但批评者指出,发电和芯片制造过程中的耗水问题仍未得到解决,这意味着总体水足迹仅部分减少。
推荐使用NVIDIA的nvfp4量化版Qwen 3.6 35B,而非Unsloth版本,其性能更优。该模型可在HuggingFace上获取,用于AI应用。
据报道,SpaceX与Reflection AI签署了一项63亿美元的计算交易,确保其在2029年前获得位于孟菲斯Colossus集群的Nvidia GB300 GPU使用权。
Valve发布了SteamOS 3.8.10,改进了桌面硬件兼容性,包括早期Nvidia驱动支持,允许用户自行打造类似Steam Machine的游戏PC。该更新旨在让SteamOS更易于安装在自定义硬件上,但目前尚不支持双系统启动。
SpaceX 与开源 AI 实验室 Reflection AI 签署了一项价值高达 63 亿美元的算力协议,Reflection 每月支付 1.5 亿美元,以获取英伟达最新 AI 芯片的使用权,支持其开放权重 AI 模型。
NVIDIA宣布推出适用于机器人的Halos系统,这是业界首个面向物理AI的全栈安全系统,基于超过18,600工程年的自动驾驶安全开发经验。Agility Robotics成为首家将该系统用于其工业环境中的人形机器人的公司。
A DIY enthusiast created a single-slot, low-profile NVIDIA V100 GPU, showcasing custom hardware modding in the PC building community.
NVIDIA Halos 是一个全栈式自动驾驶安全系统,它整合了车辆架构、AI模型、芯片、软件、工具和服务中的安全要素,确保从云端到车辆的安全开发和部署。
JUPITER是欧洲首台由NVIDIA Grace Hopper驱动的百亿亿次超级计算机,在ISC上展示了四个突破性项目:细胞级人类大脑映射、1千米分辨率气候模拟、为无线网络构建AI以及模拟50量子比特量子计算机。
由NVIDIA AI基础设施支持的NAIRR试点计划已支持超过700个研究项目,包括开发用于流体模拟的Walrus基础模型和用于储能的MIST分子基础模型。
NVIDIA 宣布其 Vera CPU 将为洛斯阿拉莫斯国家实验室的新超级计算机提供动力,为代理型 AI 模拟和科学工作负载带来显著性能提升。
NVIDIA宣布推出新的AI软件库和微服务——DAQIRI、ALCHEMI和cuPhoton——大幅加速天文学、材料科学和粒子物理等领域的科学计算任务,相比基于CPU的流水线可实现高达14,900倍的加速。
Eco Wave Power 利用 NVIDIA AI 基础设施和数字孪生将海洋波浪能转化为清洁电力,借助现有海洋基础设施来应对日益增长的 AI 能源需求。