gpu-cluster

标签

Cards List
#gpu-cluster

@MaxForAI: http://Z.ai和清华这篇ZCube,做Infra的家人们值得看下。 很多人聊AI infra,第一反应还是GPU、显存、量化、推理框架。 但到长上下文和Prefill-Decode分离之后,网络已经不再是机房里的「配角」了。 每一…

X AI KOLs Timeline · 2026-05-21

ZCube是一种新的网络架构,通过打平拓扑并混合单/多轨接入,优化了长上下文和PD分离场景下的KV Cache传输,在GLM-5.1生产集群中实现了交换机/光模块成本降低33%、GPU推理吞吐提升15%、TTFT P99下降40.6%。

0 人收藏 0 人点赞
#gpu-cluster

@Zai_org: https://x.com/Zai_org/status/2057216685040443743

X AI KOLs Timeline · 2026-05-20 缓存

本文介绍了ZCube,一种由Z.ai、Harnets.AI和清华大学提出的新型网络架构,用于解决Prefill-Decode分离式LLM推理集群中由拓扑引起的拥塞问题。在GLM-5.1编码工作负载的生产部署中,网络CapEx降低了33%,吞吐量提升了15%,TTFT P99延迟降低了40.6%。

0 人收藏 0 人点赞
#gpu-cluster

@zostaff: 20年前,Jane Street的整个计算集群只是堆放在办公室一排尽头的六台戴尔机箱。……

X AI KOLs Timeline · 2026-05-18 缓存

Jane Street允许Dwarkesh Patel参观其位于德克萨斯州的新数据中心,该中心拥有4,032个GPU,每个机架功耗达140千瓦,突显了其巨大规模与独特的网络选择。

0 人收藏 0 人点赞
#gpu-cluster

@0xCheshire: Jane Street 刚刚公开了得州 AI 训练中心的内部画面: 4032 张 GPU 、 8000 公里光纤,以及因为风冷压不住而全面启用的液冷系统。 但真正令人震撼的,是这个算力巨兽的起点。 技术负责人 Ron Minsky 回忆,…

X AI KOLs Timeline · 2026-05-16 缓存

Jane Street 公开了其位于得克萨斯州的 AI 训练中心内部画面,拥有 4032 张 GPU、8000 公里光纤和全面液冷系统,并回顾了从最初 6 台 Dell 主机的简陋起点到如今极致交易系统的 20 年进化历程。

0 人收藏 0 人点赞
#gpu-cluster

推出 Stargate UK

OpenAI Blog · 2025-09-16 缓存

# 推出 Stargate UK 来源:[https://openai.com/index/introducing-stargate-uk/](https://openai.com/index/introducing-stargate-uk/) OpenAI 我们宣布推出 Stargate UK——OpenAI 与 NVIDIA 和 Nscale 合作的 AI 基础设施项目,旨在加强英国的本土算力能力。Stargate UK 确保 OpenAI 的世界领先 AI 模型能够在英国本地计算能力上运行——特别是针对司法管辖权至关重要的专业用例。这将帮助推动英国的未来发展

0 人收藏 0 人点赞
← 返回首页

提交意见反馈