标签
黄仁勋在阿拉斯加追上空军一号,使得此前质疑其访问资格的分析人士难以自圆其说。
NVIDIA invests $320 million in Corning to expand fiber optic production capacity, highlighting the critical role of physical infrastructure in the AI era.
本文分析了 Cerebras 即将进行的 IPO,将其视为 AI 硬件领域“推理变革”的信号。文章指出,尽管 Nvidia 在基于 GPU 的训练领域占据主导地位,但为了支持推理工作负载,AI 算力的未来正变得越来越异构。
爱好者在 Mac Mini 上运行 Anthropic 的 Claude AI 所引发的热潮导致需求激增,进而造成库存短缺。
Nvidia 正在支持 Span 的一项计划,部署住宅微型数据中心,利用闲置的家庭电力运行分布式 AI 工作负载。该方案旨在通过将 GPU 节点部署在住宅附近来规避电网限制,尽管其在实际部署中仍缺乏充分验证。
伴随投资者需求激增的报道,Cerebras Systems 正将其 IPO 价格区间上调至 150 至 160 美元。
作者指出,Every 团队高度专注于 AGI,并认为基础设施是关键的瓶颈,预测随着 Claude 等模型的进步,这一问题将变得更加严峻。
台湾初创公司Skymizer发布了HTX301,这是一款PCIe AI加速器,采用较老的28nm芯片和DDR内存,仅需240W功耗即可在本地运行700B参数的大语言模型,对Nvidia和AMD的高功耗GPU解决方案构成挑战。
作者指出,'意念转文本'是一个前景广阔的领域,目前正受到众多团队的探索,并强调软硬件协同设计对于成功实现这一技术至关重要。
一篇观点文章,重点介绍蓬勃发展的 DGX Spark 开发者社区,该社区正在协作优化硬件,尽管存在局限性,还提到了 Sparkrun 和 PrismaQuant 等项目。
文章讨论了硬件作为AI竞争优势日益增长的重要性,指出领先实验室更注重产品竞争力和计算规模,而非纯粹的AGI研究。文章强调了由此导致的消费级GPU供应紧张和硬件升级成本上升的问题。
Google 发布第八代 TPU 8t 与 TPU 8i,专为大规模预训练与推理设计,集成 SparseCore、原生 FP4,并支持 9,600 芯片级超节点,为世界模型与智能体 AI 提供算力。
Google发布第八代TPU:TPU 8t用于训练,TPU 8i用于推理,专为大规模、高能效AI智能体工作负载打造,将于今年晚些时候推出。
OpenAI与Cerebras合作,将750MW超低延迟AI计算能力整合到其平台中,旨在加速推理,并在各种工作负载中实现更快的实时AI响应。
Jony Ive 的 io Products, Inc. 团队已正式并入 OpenAI,Ive 及其设计团队 LoveFrom 在公司范围内承担深度设计和创意责任。这次合作旨在开发优先考虑设计卓越性和以人为中心创新的 AI 产品。