标签
ZCube是一种新的网络架构,通过打平拓扑并混合单/多轨接入,优化了长上下文和PD分离场景下的KV Cache传输,在GLM-5.1生产集群中实现了交换机/光模块成本降低33%、GPU推理吞吐提升15%、TTFT P99下降40.6%。
本文介绍了ZCube,一种由Z.ai、Harnets.AI和清华大学提出的新型网络架构,用于解决Prefill-Decode分离式LLM推理集群中由拓扑引起的拥塞问题。在GLM-5.1编码工作负载的生产部署中,网络CapEx降低了33%,吞吐量提升了15%,TTFT P99延迟降低了40.6%。
Jane Street允许Dwarkesh Patel参观其位于德克萨斯州的新数据中心,该中心拥有4,032个GPU,每个机架功耗达140千瓦,突显了其巨大规模与独特的网络选择。
Jane Street 公开了其位于得克萨斯州的 AI 训练中心内部画面,拥有 4032 张 GPU、8000 公里光纤和全面液冷系统,并回顾了从最初 6 台 Dell 主机的简陋起点到如今极致交易系统的 20 年进化历程。
# 推出 Stargate UK 来源:[https://openai.com/index/introducing-stargate-uk/](https://openai.com/index/introducing-stargate-uk/) OpenAI 我们宣布推出 Stargate UK——OpenAI 与 NVIDIA 和 Nscale 合作的 AI 基础设施项目,旨在加强英国的本土算力能力。Stargate UK 确保 OpenAI 的世界领先 AI 模型能够在英国本地计算能力上运行——特别是针对司法管辖权至关重要的专业用例。这将帮助推动英国的未来发展