@rohanpaul_ai: NVIDIA 刚刚发布了首个代理型 AI 基准测试结果,其中 GB300 NVL72 每兆瓦可运行多达 20 倍以上的编码代理…
摘要
NVIDIA 发布了首个代理型 AI 基准测试结果,显示 GB300 NVL72 每兆瓦可运行的编码代理数量比 H200 多出 20 倍,该测试基于 Artificial Analysis 的 AgentPerf 基准。
查看缓存全文
缓存时间: 2026/06/13 01:04
NVIDIA 刚刚发布了首个代理式 AI 基准测试结果,其中 GB300 NVL72 每兆瓦可运行的编码代理数量比 H200 高出最多 20 倍。
以往的推理基准测试大多询问系统在一次提示后能多快生成 token。
而来自 Artificial Analysis 的 AgentPerf 提出了一个更难的问题:在保持响应流畅的前提下,能同时运行多少个代理?
它测试的工作负载比常规 LLM 服务更重,因为一个代理并非一次请求加一次回答,而是一长串模型调用、代码编辑、命令执行、工具延迟以及不断增长的上下文。
该基准测试回放了来自公开仓库的、涉及 12 种以上编程语言的真实编码代理路径,请求长度从 5K 到 131K token 不等,平均约为 27K token。
NVIDIA 表示,GB300 NVL72 在最低服务层级上每兆瓦可达 61.4K 个并发代理,而 H200 仅为 2.6K 个。
这一提升源自 72 块 GPU 通过 NVLink 像一台机架级机器一样协同工作,再加上软件层将 MoE 专家工作分散、重叠通信与计算、并保持大批量处理。
@NVIDIAAIDev
相似文章
NVIDIA Blackwell 在首个自主AI基础设施基准测试中领先
NVIDIA Blackwell GB300 NVL72 平台在 Artificial Analysis 的首个自主AI基础设施基准测试 AgentPerf 中领先,每兆瓦可运行的智能体数量是上一代 Hopper 的 20 倍。
@mr_r0b0t: 16个本地AI代理同时流式传输!MiniMax M2.7 NVFP4 — 2x GB10,没有云API。
演示展示了使用MiniMax M2.7 NVFP4在两个Nvidia GB10芯片上同时流式传输16个本地AI代理,无需云API。
@rohanpaul_ai: @TensordyneInc 在推理机架方面取得了重大突破。他们刚刚宣布了一款AI推理机架,声称……
Tensordyne 发布了 Napier AI 推理机架,声称通过使用对数空间数学来降低能耗和晶体管使用量,其吞吐量是 Nvidia NVL72 GB300 的 13 倍,可能颠覆推理硬件格局。
@Saboo_Shubham_: 到2026年底,每个人都能在自己的电脑上运行一支AI代理团队。配备128GB统一内存的NVIDIA RTX Spark就是为此而生。
这条推文预测到2026年底每个人都能在PC上运行AI代理,重点介绍了配备128GB统一内存的NVIDIA RTX Spark,专为始终在线的本地代理设计,并提供了运行本地编码代理的指南。
@nicos_ai: NVIDIA 刚刚正式发布了他们用于其 AI 代理的技能集。目前他们拥有的技能包括:→ 分析…
NVIDIA 正式发布了一套用于 AI 代理的技能集,涵盖视频分析、语音代理、LLM 训练、模型加速、RAG、安全环境、物流优化和 CUDA 编程。