标签
Modal的基础设施现在实现了对稀疏工作负载的成本高效执行,解锁了长尾AI用例,这些用例之前因计算资源利用率低导致成本过高而难以实现。
Anthropic已与SpaceX建立合作关系以获取计算资源,社交媒体评论将此交易比作一个梗,突显了这一点。
OpenAI与Cerebras合作,将750MW超低延迟AI计算能力整合到其平台中,旨在加速推理,并在各种工作负载中实现更快的实时AI响应。
AWS 和 OpenAI 宣布建立多年期、价值 38 亿美元的战略合作伙伴关系,为 OpenAI 提供即时访问 AWS 世界一流基础设施的权限,包括数十万块 NVIDIA GPU 和扩展至数千万个 CPU 用于先进 AI 工作负载的能力。
AMD 和 OpenAI 宣布战略合作伙伴关系,将部署 6 吉瓦 AMD Instinct GPU,初期部署 1 吉瓦,从 2026 年下半年开始。AMD 将向 OpenAI 发行最多 1.6 亿股认股权证,归属与部署里程碑和财务目标挂钩。
# AI 与效率 来源: [https://openai.com/index/ai-and-efficiency/](https://openai.com/index/ai-and-efficiency/) 训练到 AlexNet 水平性能所需的总计算量(万亿浮点运算次/秒-天)。任意给定时间的最低计算点以蓝色显示,所有测量点以灰色显示。[2](https://openai.com/index/ai-and-efficiency/#citation-bottom-2),[5](https://openai.com/index/ai-and-efficiency/#citation-bottom-5),[6](https://openai.com/index/ai-and-efficiency/#citation-bottom-6),