OpenAI与Broadcom发布专为LLM推理优化的芯片

OpenAI Blog 2026/06/24 06:00 产品

inference-chip llm hardware openai broadcom ai-acceleration custom-silicon

摘要

OpenAI与Broadcom发布了Jalapeño，一款专为LLM推理定制的芯片，每瓦性能显著优于当前最先进水平，从零开始为当前及未来AI模型设计。

OpenAI与Broadcom推出了Jalapeño，一款专为LLM推理构建的定制AI芯片，旨在提升AI系统的性能、效率和规模。

查看原文

查看缓存全文

缓存时间: 2026/06/24 13:52

# OpenAI与Broadcom推出面向LLM优化的推理芯片来源：https://openai.com/index/openai-broadcom-jalapeno-inference-chip/ - 早期测试显示，第一代加速器的每瓦性能将大幅超越当前最先进水平 - 从头为业界当前及未来的LLM打造 - 从设计到量产仅用九个月，借助OpenAI模型加速开发 - 扩展OpenAI全栈平台，从产品、模型延伸至芯片 - 将与数据中心合作伙伴在多代产品中以吉瓦级规模部署 OpenAI与Broadcom（纳斯达克：AVGO）今日发布Jalapeño——OpenAI首款智能处理器：这一加速器围绕OpenAI对LLM推理未来的愿景进行架构设计，也是两家公司共同打造的多代计算平台中的首款AI加速器，旨在让先进AI更快、更可靠、更易为更多人使用。 OpenAI与Broadcom高层展示Jalapeño推理芯片。 Jalapeño由Broadcom总裁兼CEO Hock Tan与总裁Charlie Kawwas交付给OpenAI CEO Sam Altman和总裁Greg Brockman，标志着OpenAI构建模型与产品背后全栈战略的重要一步。 OpenAI基于对LLM底层的深入理解，结合自身模型、内核、服务系统及产品需求的路线图，从头设计了这款芯片。合作伙伴Broadcom与Celestica通过芯片实现、板级、机架系统集成、高性能网络及可扩展生产系统，帮助实现了平台的工业化。Jalapeño的设计具备灵活性，可适用于所有LLM，其背后是OpenAI对业界当前及未来AI模型推理需求的洞察。Jalapeño芯片的工程样品已在实验室中以生产目标频率和功率运行ML工作负载，包括GPT-5.3-Codex-Spark。虽然OpenAI仍在测量最终性能，但早期测试显示，Jalapeño的每瓦性能将大幅超越当前最先进水平。详细的性能技术报告将在未来几个月内发布。该架构减少了数据移动，平衡了计算、内存和网络资源，使得实际利用率更接近理论峰值性能。Broadcom的硅实现技术和网络技术（包括Tomahawk网络芯片）帮助该平台实现大规模量产。 "世界正在迈向算力驱动的经济，"OpenAI总裁兼联合创始人Greg Brockman表示。"Jalapeño是我们长期全栈基础设施战略的一部分，旨在让算力更充裕，从而使AI更快速、更可靠、更实惠地服务于个人和企业，并用于解决更重要的难题。通过自行设计更多栈层，我们可以以更高效率提供更多智能，并持续推动先进AI走向更广泛的普及。" "Jalapeño完全针对LLM推理设计，基于我们与OpenAI研究人员的紧密合作所获得的详细洞察，"OpenAI硬件项目负责人Richard Ho表示。"我们围绕对前沿AI模型最重要的内核、内存移动、网络和服务模式，对架构进行了优化。根据早期测试，Jalapeño将以接近硬件理论极限的效率执行我们最重要的任务。" "我们与OpenAI的合作代表着对扩展未来十年AI所需物理基础设施的根本承诺，"Broadcom总裁兼CEO Hock Tan表示。"这只是一个多代路线图的开端。通过直接与OpenAI共同开发业界领先的芯片，我们正从2026年开始，与微软及其他合作伙伴共同支持吉瓦级数据中心的部署。" ## 旨在成为LLM最佳推理平台 Jalapeño是为现代LLM推理从头设计的架构，并非从早期AI工作负载改造而来的通用加速器。它汲取了OpenAI在ChatGPT、Codex、API及未来智能体产品中每天运行的系统经验，同时也面向业界当前及未来的LLM。其目标是将当今领先AI加速器的算力与吞吐量，与最快专用推理系统的低延迟相结合，使Jalapeño非常适合大规模交互式LLM产品。这正是全栈优势所在。OpenAI不仅开发前沿模型或在其之上构建产品，还在设计其底层基础设施：芯片架构、内核、内存系统、网络、调度、部署系统及产品体验。由于OpenAI拥有全栈运营能力，每一层都能围绕同一目标进行优化：让模型对用户更快、更可靠、更实惠。 Jalapeño增强了OpenAI进步背后的飞轮效应。更好的基础设施带来更高的计算效率。更高的计算效率实现更好的训练与服务，最终驱动更强大的AI模型。更好的模型转化为更好的产品，服务于个人、开发者和企业。更好的产品带来更多使用量、更多客户及更多收入，使OpenAI能够投资于下一代基础设施。随着时间的推移，这一循环有助于让智能更强大、更可靠、更便宜地惠及所有人。 ## 九个月流片，OpenAI模型加速 Jalapeño从初始设计到制造流片仅用了九个月，这一定制AI加速器项目实现了我们认为高性能先进半导体领域最快的ASIC开发周期。如此速度得益于OpenAI工程团队与Broadcom芯片实现专家的软硬件协同开发，以及OpenAI模型在设计与优化过程中部分环节的加速应用。正在为用户服务的同一批模型，也在帮助改进运行未来模型所需的基础设施。如果AI能帮助工程师更快设计出更好的芯片，便能降低全行业的算力成本，助力先进AI的普及。 ## 与合作伙伴共同打造多代平台 Jalapeño是多代计算平台的第一步，计划于2026年底前首次部署，并在未来数年持续扩展。该平台结合了OpenAI设计的加速器、Broadcom的芯片实现与网络连接技术，以及Celestica的板级、机架和系统专长。 ## 让先进AI更广泛可用这项工作的意义很简单：推理是AI触及用户的关键环节。成本、速度和可靠性的每一次提升，都可能体现为更快的ChatGPT回答、更少等待即可完成更多步骤的Codex任务、更廉价的API产品构建，或高需求时更稳定的访问体验。普及AI意味着让先进模型足够可用、可靠且经济，使更多人能够日常使用。Jalapeño帮助OpenAI将更多基础设施转化为有用的智能，服务于学生、开发者、小企业、研究者、企业以及所有试图学习、创造或解决难题的人。

OpenAI与Broadcom发布专为LLM推理优化的芯片

相似文章

OpenAI 推出其首款定制芯片，由 Broadcom 制造

OpenAI 发布首个AI处理器：Jalapeño

OpenAI 推出与 Broadcom 合作设计的定制芯片，以增强其 AI 基础设施

Cerebras芯片组似乎针对LLM应用进行优化

OpenAI 和 Broadcom 宣布战略合作，部署 10 吉瓦 OpenAI 设计的 AI 加速器

提交意见反馈