NVIDIA与AWS合作,将AI大规模投入生产
摘要
NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例,以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能,使企业能够以更优的性能和更低的运营复杂性,大规模部署AI应用。
<div id="bsf_rt_marker"></div><p><span style="font-weight: 400;">大规模构建AI系统极具挑战性,需要低延迟推理、快速向量搜索、强大的GPU性价比,以及能够在不增加运营复杂性的前提下扩展的基础设施。</span></p>
<p><span style="font-weight: 400;">NVIDIA与Amazon Web Services(AWS)的最新合作解决了上述每一项挑战。通过Amazon OpenSearch和Amazon EC2,NVIDIA AI基础设施为企业提供了更实用的路径,以大规模部署AI。</span></p>
<p><span style="font-weight: 400;">由NVIDIA RTX PRO 4500 Blackwell服务器版GPU驱动的EC2 G7实例,扩展了AI、图形、视频和数据分析工作负载的计算层;同时NVIDIA cuVS库通过将GPU加速的向量索引设为OpenSearch Serverless的默认选项,加速了检索层。随着AWS获得NVIDIA GB300的NVIDIA Exemplar云状态,客户可以确信其训练工作负载获得了优化后的峰值性能。</span></p>
<h2><b>NVIDIA RTX PRO 4500 Blackwell服务器版多工作负载GPU为全新Amazon EC2 G7实例提供动力</b></h2>
<p><span style="font-weight: 400;">Amazon EC2 G7实例将NVIDIA RTX PRO 4500 Blackwell服务器版GPU引入AWS,用于AI推理、图形、空间计算和GPU加速数据分析——提供一种专为生产工作负载设计的新实例类型,这些工作负载需要性能,但又无需承担客户管理GPU平台的运营开销。</span></p>
<p><span style="font-weight: 400;">与G6实例相比,G7在AI推理性能上提升高达4.6倍,图形性能提升高达2.1倍,并且在使用NVIDIA cuDF库进行Apache Spark工作负载时,Amazon EMR上的GPU加速数据分析速度显著提升。</span></p>
<p><span style="font-weight: 400;">通过支持最多八个GPU、256GB总GPU内存、700 Gbps的EFA网络连接以及最多7.6TB本地NVMe SSD存储——涵盖单、双、四、八GPU配置,裸机即将推出——G7实例让客户能够根据工作负载合理调整基础设施规模,而无需过度配置。</span></p>
<p><span style="font-weight: 400;">该平台的多功能性意味着AI团队可获得更低延迟的推理。媒体和娱乐团队可获得高分辨率视频工作流和渲染。模拟、计算机辅助设计、虚拟桌面基础设施、游戏和空间计算团队可使用相同的实例类型处理图形密集型应用。数据团队可将GPU内存、本地存储和网络改进应用于分析管道和向量数据库工作负载。</span></p>
<p><span style="font-weight: 400;">G7实例可通过AWS深度学习Amazon机器映像(AMI)、Amazon深度学习容器、Amazon EMR、Amazon EKS、Amazon ECS和图形AMI访问——并即将在Amazon SageMaker AI中推出。</span></p>
<h2><b>NVIDIA cuVS使GPU加速向量搜索成为Amazon OpenSearch的默认选项</b></h2>
<p><span style="font-weight: 400;">下一代Amazon OpenSearch Serverless为代理AI和动态工作负载提供支持,无需管理基础设施。它采用由NVIDIA cuVS驱动的GPU加速向量索引,作为所有向量集合的默认计算选择。</span></p>
<p><span style="font-weight: 400;">对于构建</span><a href="https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/"><span style="font-weight: 400;">检索增强生成</span></a><span style="font-weight: 400;">、语义搜索、推荐系统和代理AI应用的团队而言,这一转变至关重要。它将GPU驱动的向量搜索从一项专门的优化项目转变为AWS的标准能力。</span></p>
<p><span style="font-weight: 400;">对客户的影响是直接的:与仅使用CPU的构建相比,向量索引速度提升高达10倍,成本仅为四分之一——使得在不到一小时内构建十亿级向量数据库变得切实可行。</span></p>
<p><span style="font-weight: 400;">通过将NVIDIA cuVS设为OpenSearch Serverless的默认选项,AWS客户获得了从原始数据到生产级AI检索基础设施的更快路径——借助无服务器扩展,在工作负载空闲时降低运营开销。</span></p>
<h2><b>AWS获得NVIDIA GB300训练性能的Exemplar云状态</b></h2>
<p><span style="font-weight: 400;">AWS已获得NVIDIA GB300上训练工作负载的NVIDIA Exemplar云状态。这意味着AWS达到了NVIDIA用于对其参考架构进行AI工作负载基准测试的严格性能阈值。</span></p>
<p><span style="font-weight: 400;">这一成就是AWS与NVIDIA团队深度协同工程的结果。通过NVIDIA Exemplar云计划,开发者和AI领导者可以确信,他们正在使用一致的高性能云基础设施进行大规模训练,帮助团队以更大的信心评估云提供商,改善总体拥有成本,并更高效地将AI项目从规划推进到生产。</span></p>
<p><span style="font-weight: 400;">这些进步共同强化了AWS上AI基础设施栈的每一层。核心主线一致:生产级AI基础设施能够大规模运行,且不会增加运营团队的负担。</span></p>
<p><i><span style="font-weight: 400;">了解更多信息,请参阅</span></i><a target="_blank" href="https://aws.amazon.com/about-aws/whats-new/2026/06/amazon-ec2-g7-generally-available/"><i><span style="font-weight: 400;">这篇AWS博客</span></i></a><i><span style="font-weight: 400;">。</span></i></p>
查看缓存全文
缓存时间: 2026/06/24 01:43
# NVIDIA 与 AWS 合作,大规模将 AI 投入生产
大规模构建 AI 系统要求严苛,需要低延迟推理、快速向量搜索、强劲的 GPU 性价比以及能够在不增加运营复杂性的前提下扩展的基础设施。
NVIDIA 与 Amazon Web Services (AWS) 的最新合作解决了上述每一项挑战。通过 Amazon OpenSearch 和 Amazon EC2,NVIDIA AI 基础设施为企业提供了更多将 AI 部署到生产规模的实际路径。
由 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU 驱动的 EC2 G7 实例扩展了 AI、图形、视频和数据分析工作负载的计算层;而 NVIDIA cuVS 库则通过让 GPU 驱动的向量索引成为 OpenSearch Serverless 的默认选项,加速了检索层。此外,AWS 在 NVIDIA GB300 上获得了 NVIDIA Exemplar Cloud 状态,客户可以确信其训练工作负载能够获得峰值优化性能。
## **NVIDIA RTX PRO 4500 Blackwell Server Edition 多工作负载 GPU 驱动全新 Amazon EC2 G7 实例**
Amazon EC2 G7 实例将 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU 引入 AWS,用于 AI 推理、图形、空间计算和 GPU 加速数据分析——该实例类型专为需要高性能但无需管理 GPU 平台运营开销的生产工作负载而设计。
与 G6 实例相比,G7 提供高达 4.6 倍的 AI 推理性能、高达 2.1 倍的图形性能,以及在使用 NVIDIA cuDF 库处理 Apache Spark 工作负载时,在 Amazon EMR 上实现显著更快的 GPU 加速数据分析。
G7 实例支持最多 8 个 GPU、256GB 总 GPU 内存、700 Gbps 的 EFA 网络、高达 7.6TB 的本地 NVMe SSD 存储——提供一、二、四和八 GPU 配置,裸机即将推出——让客户能够根据工作负载适当调整基础设施规模,而不是过度配置。
该平台的多功能性意味着 AI 团队可以获得更低延迟的推理。媒体和娱乐团队可以获得高分辨率视频工作流和渲染。仿真、计算机辅助设计、虚拟桌面基础设施、游戏和空间计算团队可以使用相同的实例类型处理图形密集型应用。数据团队可以将 GPU 内存、本地存储和网络改进应用到分析管道和向量数据库工作负载中。
G7 实例可通过 AWS Deep Learning Amazon Machine Images (AMI)、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS 和图形 AMI 使用——即将登陆 Amazon SageMaker AI。
## **NVIDIA cuVS 使 GPU 加速向量搜索成为 Amazon OpenSearch Serverless 的默认选项**
下一代 Amazon OpenSearch Serverless 为智能 AI 和动态工作负载提供动力,无需任何基础设施管理。它采用由 NVIDIA cuVS 驱动的 GPU 加速向量索引作为所有向量集合的默认计算选择。
对于构建检索增强生成 (https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/)、语义搜索、推荐系统和智能 AI 应用的团队来说,这一转变至关重要。它将 GPU 驱动的向量搜索从专业化优化项目变为 AWS 的标准能力。
对客户的影响直接:与仅 CPU 构建相比,向量索引速度提升高达 10 倍,成本仅为四分之一——使得在不到一小时内构建十亿级向量数据库成为可能。
通过在 OpenSearch Serverless 中将 NVIDIA cuVS 设为默认选项,AWS 客户能够以更快的路径从原始数据进入生产就绪的 AI 检索基础设施——同时借助无服务器扩展,在工作负载空闲时降低运营开销。
## **AWS 在 GB300 训练性能上获得 NVIDIA Exemplar Cloud 状态**
AWS 在 NVIDIA GB300 上针对训练工作负载获得了 NVIDIA Exemplar Cloud 状态。这意味着 AWS 满足了 NVIDIA 用于对照其参考架构基准测试 AI 工作负载的严格性能阈值。
这一成就是 AWS 与 NVIDIA 团队深度协同工程的结果。通过 NVIDIA Exemplar Clouds 计划,开发者和 AI 领导者可以确信他们正在使用一致的高性能云基础设施进行大规模训练,从而帮助团队更自信地评估云提供商、改善总体拥有成本,并更高效地将 AI 项目从规划推向生产。
总的来说,这些进步强化了 AWS 上 AI 基础设施堆栈的每一层。主线始终如一:支持大规模运行的生产级 AI 基础设施,同时不增加运行团队的运营负担。
*了解更多,请参阅**这个 AWS 博客*** (https://aws.amazon.com/about-aws/whats-new/2026/06/amazon-ec2-g7-generally-available/)。
相似文章
AWS 和 OpenAI 宣布多年战略合作伙伴关系
AWS 和 OpenAI 宣布建立多年期、价值 38 亿美元的战略合作伙伴关系,为 OpenAI 提供即时访问 AWS 世界一流基础设施的权限,包括数十万块 NVIDIA GPU 和扩展至数千万个 CPU 用于先进 AI 工作负载的能力。
@CNET:Nvidia GTC 2026,黄仁勋谈“AI原生”投资
Supermicro 与 NVIDIA 发布交钥匙“AI Factory”参考架构,整合 Blackwell GPU、认证服务器、网络、存储与部署服务,让企业更快搭建集群级 AI 基础设施。
NVIDIA AI Cloud 生态系统全球扩展以满足全球AI计算需求
NVIDIA宣布与其合作伙伴在六大洲扩展AI Cloud生态系统,以满足全球AI计算需求,通过全栈AI基础设施支持训练、推理和自主AI工作负载。
亚马逊希望通过销售AI芯片更直接地挑战Nvidia
亚马逊网络服务(AWS)正就将其Trainium AI芯片出售给其他公司进行早期谈判,直接挑战Nvidia的主导地位。CEO安迪·贾西指出,如果对外销售芯片,这可能代表一个500亿美元的年化业务。
OpenAI 和 Amazon 宣布战略合作
OpenAI 和 Amazon 宣布达成重大多年战略合作,包括 Amazon 投资 50 亿美元、OpenAI Frontier 在 AWS 上的独家云分发,以及共同开发用于企业 AI 应用的有状态运行时环境。