OpenAI与Cerebras合作
摘要
OpenAI与Cerebras合作,将750MW超低延迟AI计算能力整合到其平台中,旨在加速推理,并在各种工作负载中实现更快的实时AI响应。
OpenAI与Cerebras合作,增加750MW高速AI计算能力,降低推理延迟,使ChatGPT在实时AI工作负载中运行更快。
查看缓存全文
缓存时间: 2026/04/20 14:50
# OpenAI 与 Cerebras 达成合作
来源:https://openai.com/index/cerebras-partnership/
OpenAI 正与 Cerebras 合作,为我们的平台增加 750MW 的超低延迟 AI 算力。
Cerebras 构建了专用 AI 系统,旨在加速 AI 模型的长输出过程。其独特的速度优势来自于将巨大的算力、内存和带宽集成在一块巨型芯片上,从而消除了传统硬件上制约推理速度的瓶颈。
将 Cerebras 纳入我们的算力方案组合,关键目标在于让 AI 的响应速度更快。当你提出一个难题、生成代码、创建图像或运行 AI 智能体时,后台实际上存在一个循环:你发出请求,模型进行思考,然后返回结果。当 AI 实现实时响应时,用户能完成更多任务、停留更长时间,并运行更高价值的工作负载。
我们将分阶段把这种低延迟能力整合到我们的推理栈中,并逐步扩展到各类工作负载。
“OpenAI 的算力策略是构建一个富有韧性的组合,将合适的系统匹配到合适的工作负载。Cerebras 为我们的平台提供了专用的低延迟推理解决方案。这意味着更快的响应、更自然的交互,以及将实时 AI 扩展至更多人的更坚实基础。”——OpenAI 的 Sachin Katti
“我们很高兴与 OpenAI 合作,将全球顶尖的 AI 模型引入全球最快的 AI 处理器。正如宽带改变了互联网,实时推理也将改变 AI,为构建和与 AI 模型交互带来全新方式。”——Cerebras 联合创始人兼首席执行官 Andrew Feldman
该算力容量将在 2028 年前分多批上线。
相似文章
OpenAI 和 Broadcom 宣布战略合作,部署 10 吉瓦 OpenAI 设计的 AI 加速器
OpenAI 和 Broadcom 宣布了多年战略合作,共同开发和部署 10 吉瓦的定制 AI 加速器和网络系统,部署将于 2026 年中期开始,2029 年底完成。这一合作伙伴关系使 OpenAI 能够设计加速器,将前沿模型开发中的学习直接嵌入到硬件中。
OpenAI 推出与 Broadcom 合作设计的定制芯片,以增强其 AI 基础设施
OpenAI 宣布与 Broadcom 合作设计了一款定制芯片,以增强其 AI 基础设施。
AWS 和 OpenAI 宣布多年战略合作伙伴关系
AWS 和 OpenAI 宣布建立多年期、价值 38 亿美元的战略合作伙伴关系,为 OpenAI 提供即时访问 AWS 世界一流基础设施的权限,包括数十万块 NVIDIA GPU 和扩展至数千万个 CPU 用于先进 AI 工作负载的能力。
OpenAI 和 NVIDIA 宣布战略合作,部署 10 吉瓦 NVIDIA 系统
OpenAI 和 NVIDIA 宣布了一项里程碑式的战略合作,将部署至少 10 吉瓦的 NVIDIA AI 系统,NVIDIA 将投资最高 1000 亿美元,基础设施部署从 2026 年末开始,使用 Vera Rubin 平台。
构建智能时代的计算基础设施
OpenAI宣布通过Stargate项目突破10GW计算基础设施里程碑,强调通过与生态系统合作伙伴的协作和社区参与实现快速扩张,以满足加速增长的AI需求。