标签
大型科技公司正越来越多地通过债券销售借贷以资助AI基础设施,这与其传统的现金充裕的融资模式不同,同时美联储的利率政策使债务成本更高。
AI行业GPU利用率普遍低于50%,前a16z合伙人Anjney Midha创办AMP,旨在将算力像电力一样调度,提升利用效率。文章还探讨了Anthropic的成功策略、DeepMind的论文囤积问题及非NVIDIA芯片的正确打法。
Allbirds转向AI,更名为Smartbird并融资1亿美元,成为AI基础设施提供商。新任CEO Nadia Carlsten,前AWS高管,计划组建团队,瞄准需要数据主权和可控AI计算部署的客户。
FERC命令电网运营商为AI数据中心的并网请求提供快速通道,旨在缓解电网瓶颈,但未解决发电容量短缺问题。
在支持西雅图数据中心暂停令的听证会上作证的亚马逊员工,如今面临潜在解雇,他们因此提起法律投诉,指控就业歧视。
TerraPower和Meta宣布达成协议,将开发多达八座Natrium先进核电站(每座345兆瓦),为Meta的数据中心供电。首批机组预计最早于2032年投运。这标志着Meta对先进核技术的最大支持,也是其首次直接投资新建核电项目。
法国正在借助NVIDIA技术推进其AI基础设施建设,包括Mistral的新数据中心、Scaleway基于Blackwell的实例,以及在欧洲制造Vera Rubin NVL72系统,同时进行针对本地需求的开源模型开发。
分析表明,用于AI训练的GPU经常处于闲置等待数据的状态,这让人质疑GPU短缺问题的严重性。
XDOF,一家刚结束隐身模式的初创公司,已筹集7000万美元,用于构建机器人训练的数据管道和工具,以解决物理交互数据的瓶颈问题。该公司发布了一个大型机器人操作轨迹数据集ABC,以加速机器人AI的发展。
加拿大养老金计划投资委员会承诺向印度数据中心运营商CtrlS投资高达7.41亿美元,押注印度在AI基础设施中日益重要的作用。该交易是更广泛的全球竞相建设AI工作负载数据中心的一部分。
Coherent在德克萨斯州扩建工厂破土动工,获得5000万美元CHIPS法案拨款,用于扩大AI基础设施所需的光学元件和化合物半导体生产。NVIDIA首席执行官黄仁勋强调了光学在支持大规模AI系统中的关键作用。
NVIDIA 的 Blackwell 平台在所有 MLPerf Training 6.0 基准测试中实现了最快的训练时间,扩展到 8,192 块 GPU,并且 GB300 NVL72 相比 GB200 NVL72 展示了高达 1.6 倍的性能提升。
一篇文章质疑了 AI GPU 仅能使用三年的说法,指出其来源薄弱,并引用谷歌和 AWS 的反证表明实际使用寿命长得多。
本文重新定义了Sovereign AI,将其视为供应链重新调整的挑战,而非模型开发竞赛,认为各国需要确保国内或盟友的基础设施用于AI的训练、推理和运行,这将推动对GPU、内存及其他硬件的新一轮需求。
美国政府据报将允许《联邦数据中心增强法案》(FDCEA)失效,在AI热潮和社区反对声中,取消联邦数据中心的关键网络安全与可持续性标准。
奥地利印制电路板制造商 AT&S 宣布在马来西亚新建工厂,投资20亿欧元,以扩大产能,并抓住人工智能热潮带来的需求增长。
美国政府正允许《联邦数据中心增强法案》(FDCEA)到期而不替换,这表明在日益增长的AI基础设施需求和公众反对声中,政府对数据中心监管采取放任态度。
文章从工程视角重新定义KV Cache,指出它不仅仅是推理优化技术,更是在Agent时代成为复用已计算结果的Runtime基础设施,帮助AI避免重复思考。
一篇技术指南,展示如何使用简单的粗略估算来估计大规模服务AI模型的成本,涵盖GPU带宽、矩阵乘法、令牌定价和用户容量。
NVIDIA Blackwell GB300 NVL72 平台在 Artificial Analysis 的首个自主AI基础设施基准测试 AgentPerf 中领先,每兆瓦可运行的智能体数量是上一代 Hopper 的 20 倍。