OpenAI与Broadcom发布专为LLM推理优化的芯片
摘要
OpenAI与Broadcom发布了Jalapeño,一款专为LLM推理定制的芯片,每瓦性能显著优于当前最先进水平,从零开始为当前及未来AI模型设计。
OpenAI与Broadcom推出了Jalapeño,一款专为LLM推理构建的定制AI芯片,旨在提升AI系统的性能、效率和规模。
查看缓存全文
缓存时间: 2026/06/24 13:52
# OpenAI与Broadcom推出面向LLM优化的推理芯片
来源:https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
- 早期测试显示,第一代加速器的每瓦性能将大幅超越当前最先进水平
- 从头为业界当前及未来的LLM打造
- 从设计到量产仅用九个月,借助OpenAI模型加速开发
- 扩展OpenAI全栈平台,从产品、模型延伸至芯片
- 将与数据中心合作伙伴在多代产品中以吉瓦级规模部署
OpenAI与Broadcom(纳斯达克:AVGO)今日发布Jalapeño——OpenAI首款智能处理器:这一加速器围绕OpenAI对LLM推理未来的愿景进行架构设计,也是两家公司共同打造的多代计算平台中的首款AI加速器,旨在让先进AI更快、更可靠、更易为更多人使用。
OpenAI与Broadcom高层展示Jalapeño推理芯片。
Jalapeño由Broadcom总裁兼CEO Hock Tan与总裁Charlie Kawwas交付给OpenAI CEO Sam Altman和总裁Greg Brockman,标志着OpenAI构建模型与产品背后全栈战略的重要一步。
OpenAI基于对LLM底层的深入理解,结合自身模型、内核、服务系统及产品需求的路线图,从头设计了这款芯片。合作伙伴Broadcom与Celestica通过芯片实现、板级、机架系统集成、高性能网络及可扩展生产系统,帮助实现了平台的工业化。Jalapeño的设计具备灵活性,可适用于所有LLM,其背后是OpenAI对业界当前及未来AI模型推理需求的洞察。Jalapeño芯片的工程样品已在实验室中以生产目标频率和功率运行ML工作负载,包括GPT-5.3-Codex-Spark。
虽然OpenAI仍在测量最终性能,但早期测试显示,Jalapeño的每瓦性能将大幅超越当前最先进水平。详细的性能技术报告将在未来几个月内发布。该架构减少了数据移动,平衡了计算、内存和网络资源,使得实际利用率更接近理论峰值性能。Broadcom的硅实现技术和网络技术(包括Tomahawk网络芯片)帮助该平台实现大规模量产。
"世界正在迈向算力驱动的经济,"OpenAI总裁兼联合创始人Greg Brockman表示。"Jalapeño是我们长期全栈基础设施战略的一部分,旨在让算力更充裕,从而使AI更快速、更可靠、更实惠地服务于个人和企业,并用于解决更重要的难题。通过自行设计更多栈层,我们可以以更高效率提供更多智能,并持续推动先进AI走向更广泛的普及。"
"Jalapeño完全针对LLM推理设计,基于我们与OpenAI研究人员的紧密合作所获得的详细洞察,"OpenAI硬件项目负责人Richard Ho表示。"我们围绕对前沿AI模型最重要的内核、内存移动、网络和服务模式,对架构进行了优化。根据早期测试,Jalapeño将以接近硬件理论极限的效率执行我们最重要的任务。"
"我们与OpenAI的合作代表着对扩展未来十年AI所需物理基础设施的根本承诺,"Broadcom总裁兼CEO Hock Tan表示。"这只是一个多代路线图的开端。通过直接与OpenAI共同开发业界领先的芯片,我们正从2026年开始,与微软及其他合作伙伴共同支持吉瓦级数据中心的部署。"
## 旨在成为LLM最佳推理平台
Jalapeño是为现代LLM推理从头设计的架构,并非从早期AI工作负载改造而来的通用加速器。它汲取了OpenAI在ChatGPT、Codex、API及未来智能体产品中每天运行的系统经验,同时也面向业界当前及未来的LLM。其目标是将当今领先AI加速器的算力与吞吐量,与最快专用推理系统的低延迟相结合,使Jalapeño非常适合大规模交互式LLM产品。
这正是全栈优势所在。OpenAI不仅开发前沿模型或在其之上构建产品,还在设计其底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统及产品体验。由于OpenAI拥有全栈运营能力,每一层都能围绕同一目标进行优化:让模型对用户更快、更可靠、更实惠。
Jalapeño增强了OpenAI进步背后的飞轮效应。更好的基础设施带来更高的计算效率。更高的计算效率实现更好的训练与服务,最终驱动更强大的AI模型。更好的模型转化为更好的产品,服务于个人、开发者和企业。更好的产品带来更多使用量、更多客户及更多收入,使OpenAI能够投资于下一代基础设施。随着时间的推移,这一循环有助于让智能更强大、更可靠、更便宜地惠及所有人。
## 九个月流片,OpenAI模型加速
Jalapeño从初始设计到制造流片仅用了九个月,这一定制AI加速器项目实现了我们认为高性能先进半导体领域最快的ASIC开发周期。如此速度得益于OpenAI工程团队与Broadcom芯片实现专家的软硬件协同开发,以及OpenAI模型在设计与优化过程中部分环节的加速应用。
正在为用户服务的同一批模型,也在帮助改进运行未来模型所需的基础设施。如果AI能帮助工程师更快设计出更好的芯片,便能降低全行业的算力成本,助力先进AI的普及。
## 与合作伙伴共同打造多代平台
Jalapeño是多代计算平台的第一步,计划于2026年底前首次部署,并在未来数年持续扩展。该平台结合了OpenAI设计的加速器、Broadcom的芯片实现与网络连接技术,以及Celestica的板级、机架和系统专长。
## 让先进AI更广泛可用
这项工作的意义很简单:推理是AI触及用户的关键环节。成本、速度和可靠性的每一次提升,都可能体现为更快的ChatGPT回答、更少等待即可完成更多步骤的Codex任务、更廉价的API产品构建,或高需求时更稳定的访问体验。
普及AI意味着让先进模型足够可用、可靠且经济,使更多人能够日常使用。Jalapeño帮助OpenAI将更多基础设施转化为有用的智能,服务于学生、开发者、小企业、研究者、企业以及所有试图学习、创造或解决难题的人。
相似文章
OpenAI 推出其首款定制芯片,由 Broadcom 制造
OpenAI 发布了其首款自研推理处理器 Jalapeño,与 Broadcom 合作开发,旨在提升每瓦性能并减少对 Nvidia GPU 的依赖。
OpenAI 发布首个AI处理器:Jalapeño
OpenAI 宣布了其首款定制AI推理芯片 Jalapeño,该芯片是与Broadcom合作开发的,旨在减少对Nvidia GPU的依赖,预计在2026年底前部署。
OpenAI 推出与 Broadcom 合作设计的定制芯片,以增强其 AI 基础设施
OpenAI 宣布与 Broadcom 合作设计了一款定制芯片,以增强其 AI 基础设施。
Cerebras芯片组似乎针对LLM应用进行优化
文章指出,Cerebras芯片针对LLM推理和训练进行了优化,而非通用AI工作负载,并提醒不要过度炒作其能在所有AI领域挑战NVIDIA的能力。
OpenAI 和 Broadcom 宣布战略合作,部署 10 吉瓦 OpenAI 设计的 AI 加速器
OpenAI 和 Broadcom 宣布了多年战略合作,共同开发和部署 10 吉瓦的定制 AI 加速器和网络系统,部署将于 2026 年中期开始,2029 年底完成。这一合作伙伴关系使 OpenAI 能够设计加速器,将前沿模型开发中的学习直接嵌入到硬件中。