标签
llama.cpp b9095 版本引入了针对双 Blackwell PCIe GPU 的免 NCCL 张量并行功能,使得在不依赖 NCCL 的情况下也能实现高效的多 GPU 推理。
一位用户提议使用Blackwell GPU和通过RDMA连接的高内存服务器构建异构AI集群,并寻求在Tinygrad驱动程序开发方面的合作。
在 Nvidia GTC 2026 上,CEO 黄仁勋发布了下一代 Vera Rubin 系统;Supermicro 也推出基于 Nvidia Blackwell GPU 的全栈 AI Factory 产品组合,实现企业级 AI 一站式部署。