gpu-cluster

#gpu-cluster

@JaydevTonde：今天探索了NVIDIA Dynamo，它为我们提供了很多在GPU集群中跨多个节点部署LLM的功能。它包…

X AI KOLs Timeline ↗ · 2026-07-09 缓存

探索了NVIDIA Dynamo，这是一个用于在多个GPU集群节点上部署LLM的工具，具有模型缓存、自动扩展、多节点部署以及Kubernetes集成等功能。

0 人收藏 0 人点赞

#gpu-cluster

@TheAhmadOsman: 嘿我的朋友，不错的配置。如果8x RTX PRO 6000是真正的目标，我会把它当成一个严肃的基础设施建设，而不是一个工作站……

X AI KOLs Timeline ↗ · 2026-07-07

关于搭建配备8张RTX PRO 6000 GPU的高端AI工作站的建议，强调适当的基础设施、散热，以及避免重复使用DDR4。

0 人收藏 0 人点赞

#gpu-cluster

@MaxForAI: http://Z.ai和清华这篇ZCube，做Infra的家人们值得看下。很多人聊AI infra，第一反应还是GPU、显存、量化、推理框架。但到长上下文和Prefill-Decode分离之后，网络已经不再是机房里的「配角」了。每一…

X AI KOLs Timeline ↗ · 2026-05-21

ZCube是一种新的网络架构，通过打平拓扑并混合单/多轨接入，优化了长上下文和PD分离场景下的KV Cache传输，在GLM-5.1生产集群中实现了交换机/光模块成本降低33%、GPU推理吞吐提升15%、TTFT P99下降40.6%。

0 人收藏 0 人点赞

#gpu-cluster

@Zai_org: https://x.com/Zai_org/status/2057216685040443743

X AI KOLs Timeline ↗ · 2026-05-20 缓存

本文介绍了ZCube，一种由Z.ai、Harnets.AI和清华大学提出的新型网络架构，用于解决Prefill-Decode分离式LLM推理集群中由拓扑引起的拥塞问题。在GLM-5.1编码工作负载的生产部署中，网络CapEx降低了33%，吞吐量提升了15%，TTFT P99延迟降低了40.6%。

0 人收藏 0 人点赞

#gpu-cluster

@zostaff: 20年前，Jane Street的整个计算集群只是堆放在办公室一排尽头的六台戴尔机箱。……

X AI KOLs Timeline ↗ · 2026-05-18 缓存

Jane Street允许Dwarkesh Patel参观其位于德克萨斯州的新数据中心，该中心拥有4,032个GPU，每个机架功耗达140千瓦，突显了其巨大规模与独特的网络选择。

0 人收藏 0 人点赞

#gpu-cluster

@0xCheshire: Jane Street 刚刚公开了得州 AI 训练中心的内部画面： 4032 张 GPU 、 8000 公里光纤，以及因为风冷压不住而全面启用的液冷系统。但真正令人震撼的，是这个算力巨兽的起点。技术负责人 Ron Minsky 回忆，…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

Jane Street 公开了其位于得克萨斯州的 AI 训练中心内部画面，拥有 4032 张 GPU、8000 公里光纤和全面液冷系统，并回顾了从最初 6 台 Dell 主机的简陋起点到如今极致交易系统的 20 年进化历程。

0 人收藏 0 人点赞

#gpu-cluster

推出 Stargate UK

OpenAI Blog ↗ · 2025-09-16 缓存

# 推出 Stargate UK 来源：[https://openai.com/index/introducing-stargate-uk/](https://openai.com/index/introducing-stargate-uk/) OpenAI 我们宣布推出 Stargate UK——OpenAI 与 NVIDIA 和 Nscale 合作的 AI 基础设施项目，旨在加强英国的本土算力能力。Stargate UK 确保 OpenAI 的世界领先 AI 模型能够在英国本地计算能力上运行——特别是针对司法管辖权至关重要的专业用例。这将帮助推动英国的未来发展

0 人收藏 0 人点赞

gpu-cluster

@JaydevTonde：今天探索了NVIDIA Dynamo，它为我们提供了很多在GPU集群中跨多个节点部署LLM的功能。它包…

@TheAhmadOsman: 嘿我的朋友，不错的配置。如果8x RTX PRO 6000是真正的目标，我会把它当成一个严肃的基础设施建设，而不是一个工作站……

@MaxForAI: http://Z.ai和清华这篇ZCube，做Infra的家人们值得看下。 很多人聊AI infra，第一反应还是GPU、显存、量化、推理框架。 但到长上下文和Prefill-Decode分离之后，网络已经不再是机房里的「配角」了。 每一…

@Zai_org: https://x.com/Zai_org/status/2057216685040443743

@zostaff: 20年前，Jane Street的整个计算集群只是堆放在办公室一排尽头的六台戴尔机箱。……

@0xCheshire: Jane Street 刚刚公开了得州 AI 训练中心的内部画面： 4032 张 GPU 、 8000 公里光纤，以及因为风冷压不住而全面启用的液冷系统。 但真正令人震撼的，是这个算力巨兽的起点。 技术负责人 Ron Minsky 回忆，…

推出 Stargate UK

提交意见反馈

@MaxForAI: http://Z.ai和清华这篇ZCube，做Infra的家人们值得看下。很多人聊AI infra，第一反应还是GPU、显存、量化、推理框架。但到长上下文和Prefill-Decode分离之后，网络已经不再是机房里的「配角」了。每一…

@0xCheshire: Jane Street 刚刚公开了得州 AI 训练中心的内部画面： 4032 张 GPU 、 8000 公里光纤，以及因为风冷压不住而全面启用的液冷系统。但真正令人震撼的，是这个算力巨兽的起点。技术负责人 Ron Minsky 回忆，…