NVIDIA Vera CPU 以‘重拳出击’之势挑战竞争对手
摘要
NVIDIA Vera CPU采用定制Olympus Arm核心和LPDDR5X内存,为代理型AI工作负载提供卓越性能和内存带宽,Phoronix初步基准测试已证实这一点。
<div id="bsf_rt_marker"></div><p><span style="font-weight: 400;">向代理型AI的转变给AI工厂带来了新的CPU需求:快速核心、巨大内存带宽以及在所有核心都活跃时保持高性能的能力。</span></p>
<p><span style="font-weight: 400;">Phoronix今日发布的初步基准测试结果显示,NVIDIA Vera CPU满足了这一需求。在这首次公开测试中,基准测试范围集中于Vera为现代数据中心设计的代理型工作负载。</span></p>
<p><span style="font-weight: 400;">Vera CPU在优化平台功耗的同时,提供了AI工厂所需的吞吐量。88个NVIDIA定制Olympus核心、1.2TB/s内存带宽以及高速片上结构,共同构成一个在高效功耗范围内兼顾核心性能与内存带宽的CPU平台。</span></p>
<h2><b>NVIDIA Olympus 带来强劲性能</b></h2>
<p><span style="font-weight: 400;">Vera的核心是定制的NVIDIA Olympus CPU核心。Olympus完全兼容Armv9.2指令集架构,专为支撑代理型AI的顺序CPU工作而设计:分支密集的运行时、沙箱代码、数据处理和编排。</span></p>
<p><span style="font-weight: 400;">Vera的单片芯片、宽核心、先进分支预测以及第二代NVIDIA可扩展一致性结构,帮助Vera在全部88个核心间保持数据流动。</span></p>
<p><span style="font-weight: 400;">Phoronix对单插槽Vera CPU(额定热设计功耗450瓦,内存功耗低于30瓦)的测试显示,在该功耗范围内,它提供了卓越性能,并在包括代码编译、文件压缩、视频转码、Python、Java和数据库管理在内的广泛工作负载中展现了跨代提升。</span></p>
<p><span style="font-weight: 400;">这些正是代理和AI工厂日常运行的CPU密集型任务:编译代码、执行运行时、压缩数据、查询数据库以及协调大型软件堆栈。</span></p>
<p><span style="font-weight: 400;">Phoronix创始人兼首席作者Michael Larabel写道:‘在测试之前,我真的不知道对搭载新Olympus核心的NVIDIA Vera有什么期待。但最终我意识到,这是有史以来对Intel和AMD x86_64处理器最强大的竞争。’</span></p>
<h2><b>内存性能的‘惊人优势’</b></h2>
<p><span style="font-weight: 400;">代理型工作负载并非仅受核心数量限制。它们需要高核心利用率和持续的内存带宽,使得每瓦内存性能成为整体CPU效率的关键部分。</span></p>
<p><span style="font-weight: 400;">Vera采用了第二代LPDDR5X内存子系统,与DDR5相比,每比特能耗大幅降低。这使得Vera能够提供高达1.2 TB/s的带宽——相比传统CPU,在低于30瓦的内存功耗下实现最多2倍的峰值内存带宽,而传统DDR5功耗超过100瓦。</span></p>
<p><span style="font-weight: 400;">在Phoronix STREAM TRIAD测试中,Vera保持了其峰值内存带宽的90%——达到了Phoronix测试过的任何CPU中额定峰值带宽的最高比例——并且相比传统x86 CPU,每核心内存带宽提升超过4倍。</span></p>
<p><span style="font-weight: 400;">Larabel写道:‘NVIDIA Vera凭借其LPDDR5X内存在内存性能上展现了相对于当前Intel Xeon和AMD EPYC处理器的惊人优势。’</span></p>
<p><span style="font-weight: 400;">然而,峰值带宽只是故事的一部分。AI工厂工作负载同时运行许多沙箱、工具调用和数据服务。在与Vera的单独测试中,Prime Intellect发现,随着更多工作负载并行运行,Vera保持了高带宽和低且一致的内存延迟——这正是代理型AI所需的那种可预测性能。</span></p>
<h2><b>巨大的跨代飞跃——Phoronix测试中的领先地位</b></h2>
<p><span style="font-weight: 400;">与前代NVIDIA Grace CPU相比,Vera在Phoronix测试中实现了1.6倍的几何平均提升——这是一个令人难以置信的代际增益。</span></p>
<p><span style="font-weight: 400;">Larabel写道:‘从Grace到Vera的差异持续超出了我对处理器代际性能的通常预期。NVIDIA Vera CPU凭借其内部设计的Olympus CPU核心,最终展现出了对Intel/AMD x86_64 CPU的重拳出击般的竞争力,这是我从未在任何其他ARM或非x86_64处理器上见过的。’</span></p>
<p><span style="font-weight: 400;">Vera在测试的CPU领域中领先,与最新一代128核x86处理器相比,整体性能优势达1.5倍。这些增益体现在实际的开发者工作负载中。单插槽Vera仅用20秒就编译了一个默认的Linux内核,这是Phoronix在该测试中测得的最快结果。与128核处理器相比,Vera在每核心基础上实现了2倍的Linux内核编译速度。</span></p>
<p><span style="font-weight: 400;">Larabel写道:‘在几何平均基础上,NVIDIA Vera的性能比AMD EPYC 9575F 5.0 GHz高频处理器高出10%。’</span></p>
<h2><b>Vera客户测试中,即将由合作伙伴推出</b></h2>
<p><span style="font-weight: 400;">在NVIDIA GTC上,NVIDIA宣布了对Vera的广泛生态系统支持,涵盖AI原生企业、超算中心、云服务提供商和基础设施提供商。</span></p>
<p><span style="font-weight: 400;">NVIDIA还向领先的AI公司和云提供商交付了首批Vera CPU,标志着Vera在今年下半年向合作伙伴供货迈出了重要里程碑。</span></p>
<p><span style="font-weight: 400;">Vera将通过合作伙伴以双插槽和单插槽系统提供,并提供风冷和液冷选项,以支持从标准企业数据中心到高密度代理型AI基础设施的AI工厂部署。</span></p>
<p><span style="font-weight: 400;">了解更多关于 </span><a target="_blank" href="https://www.nvidia.com/en-us/data-center/vera-cpu/"><span style="font-weight: 400;">NVIDIA Vera</span></a><span style="font-weight: 400;">。 </span></p>
查看缓存全文
缓存时间: 2026/05/27 03:01
# NVIDIA Vera CPU 重拳出击,力压竞争对手
来源:https://blogs.nvidia.com/blog/vera-cpu-phoronix/
向智能体人工智能的转变,为AI工厂带来了新的CPU需求:快速的核心、巨大的内存带宽,以及所有核心都处于活动状态时维持高性能的能力。
Phoronix今日发布的初步基准测试结果显示,NVIDIA Vera CPU能够满足这一需求。在这首次公开亮相中,基准测试的范围聚焦于Vera在现代数据中心中为之设计的智能体工作负载。
Vera CPU在优化平台功耗的同时,提供了AI工厂所需的吞吐量。88个NVIDIA定制奥林巴斯核心、1.2TB/s的内存带宽以及高速片上结构,使得该CPU平台能够在高效的功耗范围内,兼具核心性能和内存带宽。
## **NVIDIA奥林巴斯带来激进性能**
Vera的核心是定制的NVIDIA奥林巴斯CPU核心。奥林巴斯完全兼容Armv9.2指令集架构,专为支撑智能体AI的顺序CPU工作而设计:分支密集型运行时、沙盒代码、数据处理和编排。
Vera的单片芯片、宽核心、先进的分支预测以及第二代NVIDIA可扩展一致性结构,帮助Vera在全部88个核心间保持数据流动。
Phoronix对单插槽Vera CPU(额定热设计功耗450瓦,内存功耗低于30瓦)的测试表明,该处理器在该功耗配置下展现了出色的性能,并在代码编译、文件压缩、视频转码、Python、Java和数据库管理等广泛的工作负载中实现了代际提升。
这些正是智能体和AI工厂每天运行的重度CPU任务:编译代码、执行运行时、压缩数据、查询数据库以及协调大型软件栈。
“开始之前,我并不真正期待NVIDIA的Vera和新奥林巴斯核心能带来什么,”Phoronix创始人兼主笔Michael Larabel写道,“但最终我意识到,这是有史以来对Intel和AMD x86_64处理器最强大的竞争。”
## **内存性能方面拥有‘令人难以置信的优势’**
智能体工作负载并不只受核心数量的限制。它们需要高核心利用率和持续的内存带宽,这使得每瓦内存性能成为整体CPU效率的关键部分。
Vara采用了第二代LPDDR5X内存子系统,与DDR5相比,每比特能耗显著降低。这使得Vera能够提供高达1.2TB/s的带宽——相比传统CPU,峰值内存带宽提升至多2倍,而内存功耗低于30瓦,传统DDR5则超过100瓦。
在Phoronix STREAM TRIAD测试中,Vera维持了其峰值内存带宽的90%——实现了Phoronix测试过的所有CPU中额定峰值带宽百分比最高的成绩——并且相比传统x86 CPU,每核心内存带宽提升了超过4倍。
“NVIDIA Vera凭借其LPDDR5X内存在内存性能上展现了相对于当前Intel Xeon和AMD EPYC处理器的令人难以置信的优势,”Larabel写道。
然而,峰值带宽只是故事的一部分。AI工厂工作负载同时运行大量沙盒、工具调用和数据服务。在Vera的另一项测试中,Prime Intellect发现,随着更多工作负载并行运行,Vera仍能保持高带宽和低且一致的内存延迟——这正是智能体AI所需的那种可预测性能。
## **巨大的代际飞跃——以及Phoronix测试中的领先地位**
与上一代NVIDIA Grace CPU相比,Vera在Phoronix的测试中实现了1.6倍的几何平均提升——这是一个令人难以置信的代际增益。
“从Grace到Vera的差异始终超出我对处理器常规代际性能表现的预期,”Larabel写道,“NVIDIA的Vera CPU及其内部设计的奥林巴斯核心,最终对Intel/AMD x86_64 CPU形成了前所未有的重拳出击——这是我在任何其他ARM或非x86_64处理器上从未见过的竞争力。”
Vera在测试的CPU中领先,相比最新一代128核心的x86处理器,整体性能优势达到1.5倍。这些增益体现在实际的开发者工作负载中。单插槽Vera仅用20秒便编译完成了默认的Linux内核,这是Phoronix在该测试中测得的最快结果。与128核心处理器相比,Vera在每核心基础上实现了2倍的Linux内核编译速度。
“从几何平均来看,NVIDIA Vera的性能比AMD EPYC 9575F 5.0GHz高频处理器高出10%,”Larabel写道。
## **客户测试中的Vera,合作伙伴即将推出**
在NVIDIA GTC上,NVIDIA宣布了广泛的Vera生态系统支持,涵盖AI原生企业、超算中心、云服务提供商和基础设施提供商。
NVIDIA还向领先的AI公司和云提供商交付了首批Vera CPU,这标志着Vera朝着今年下半年合作伙伴可用的目标迈出了重要一步。
Vera将以双插槽和单插槽系统的形式从合作伙伴处获得,并提供风冷和液冷选项,以支持从标准企业数据中心到高密度智能体AI基础设施的AI工厂部署。
了解更多关于NVIDIA Vera的信息。
相似文章
NVIDIA刚刚发布了全新的Vera CPU——据称比x86快两倍
NVIDIA宣布了采用全新Vera架构的CPU,该架构从头开始为智能代理AI和强化学习而设计,声称性能达到x86替代方案的两倍。Vera Rubin NVL72平台集成了72个GPU和36个CPU,主要客户包括Meta、Oracle和Alibaba。
Vera到来:英伟达首款为智能体打造的CPU抵达顶级AI实验室
英伟达亲手将首批Vera CPU交付给Anthropic、OpenAI、甲骨文云基础设施和SpaceXAI,标志着专为智能体AI工作负载设计的CPU到来。
@elonmusk: Vera nice, Vera nice …
Elon Musk 对 NVIDIA 关于 Vera CPU 的公告表示赞赏,NVIDIA 感谢 SpaceX 和 Musk 试用。
Nvidia 的 Vera CPU、DGX Station、Windows PC 都指向同一个目标:本地运行的 AI 代理
Nvidia CEO Jensen Huang 宣布了 Vera CPU、适用于 Windows 的 DGX Station 以及其他 PC,旨在支持本地 AI 代理,强调本地推理以控制 token 成本。
@benitoz: Rene Haas 在昨日的 Arm 第四季度财报电话会议上刚刚确认了 Vera CPU 论点。他并非有意如此——他的表述是:GPU 受限于光刻掩模版尺寸。
Rene Haas 在 Arm 财报电话会议上的言论被解读为确认了“Vera CPU 论点”,暗示在 NVIDIA GPU 基础设施之外,转向专用 CPU 编排以处理代理型 AI 工作负载。