NVIDIA 与 Google Cloud 携手推动智能体 AI 与物理 AI 的发展

NVIDIA Blog 新闻

摘要

NVIDIA 与 Google Cloud 宣布深化合作,以推进智能体 AI 和物理 AI 的发展,推出了由 NVIDIA Vera Rubin 驱动的全新 A5X 实例,并将 Gemini 企业智能体平台与 NVIDIA NeMo 集成。

<div id="bsf_rt_marker"></div><p><span style="font-weight: 400;">NVIDIA 与 Google Cloud 已合作十余年,共同构建了一个覆盖全技术栈的 AI 平台——从性能优化的库和框架到企业级云服务。</span></p> <p><span style="font-weight: 400;">这一基础使开发人员、初创企业和企业能够将智能体 AI 和物理 AI 从实验室推向生产环境——从管理复杂工作流的智能体,到工厂车间的机器人和数字孪生。</span></p> <p><span style="font-weight: 400;">在本周于拉斯维加斯举行的 Google Cloud Next 大会上,双方合作达到新里程碑,通过扩展 Google Cloud AI Hypercomputer(AI 超级计算机)以支持 AI 工厂,从而推动智能体 AI 和物理 AI 进入下一个前沿领域。</span></p> <p><span style="font-weight: 400;">这些进展包括由 </span><a target="_blank" href="https://www.nvidia.com/en-us/data-center/technologies/rubin/"><span style="font-weight: 400;">NVIDIA Vera Rubin</span></a><span style="font-weight: 400;"> 驱动的全新 A5X 裸金属实例;在搭载 </span><a target="_blank" href="https://www.nvidia.com/en-us/data-center/technologies/blackwell-architecture/"><span style="font-weight: 400;">NVIDIA Blackwell</span></a><span style="font-weight: 400;"> 和 NVIDIA Blackwell Ultra GPU 的 Google Distributed Cloud 上运行的 Google Gemini </span><span style="font-weight: 400;">预览版</span><span style="font-weight: 400;">;搭载 NVIDIA Blackwell GPU 的机密虚拟机;以及结合 </span><a target="_blank" href="https://www.nvidia.com/en-us/ai-data-science/foundation-models/nemotron/"><span style="font-weight: 400;">NVIDIA Nemotron</span></a><span style="font-weight: 400;"> 开放模型和 </span><a target="_blank" href="https://www.nvidia.com/en-us/ai-data-science/products/nemo/"><span style="font-weight: 400;">NVIDIA NeMo</span></a><span style="font-weight: 400;"> 框架,在 Gemini 企业智能体平台上实现的智能体 AI。</span></p> <h2><b>下一代基础设施:从 NVIDIA Blackwell 到 Vera Rubin</b></h2> <p><span style="font-weight: 400;">在 Google Cloud Next 大会上,谷歌宣布了由 </span><a target="_blank" href="https://www.nvidia.com/en-us/data-center/vera-rubin-nvl72/"><span style="font-weight: 400;">NVIDIA Vera Rubin NVL72</span></a><span style="font-weight: 400;"> 机架级系统驱动的 A5X 实例。通过芯片、系统和软件之间的极致协同设计,与前一代相比,其每令牌的推理成本降低高达 10 倍,每兆瓦的令牌吞吐量提高 10 倍。</span></p> <p><span style="font-weight: 400;">A5X 将使用 </span><a target="_blank" href="https://www.nvidia.com/en-us/networking/products/ethernet/supernic/"><span style="font-weight: 400;">NVIDIA ConnectX-9 SuperNICs</span></a><span style="font-weight: 400;">,结合下一代 Google Virgo 网络技术,单个站点集群可扩展至多 </span><span style="font-weight: 400;">80,000</span><span style="font-weight: 400;"> 个 NVIDIA Rubin GPU,多站点集群可扩展至多 </span><span style="font-weight: 400;">960,000</span><span style="font-weight: 400;"> 个 NVIDIA Rubin GPU,使客户能够在 NVIDIA 优化的基础设施上运行其最大规模的 AI 工作负载。</span></p> <p><span style="font-weight: 400;">“在 Google Cloud,我们相信未来十年的 AI 发展将由客户在真正集成且针对 AI 优化的基础设施堆栈上运行最具挑战性工作负载的能力所塑造,”</span><span style="font-weight: 400;">Google Cloud AI 和计算基础设施副总裁兼总经理 Mark Lohmeyer 表示。</span> <span style="font-weight: 400;">“通过将 Google Cloud 可扩展的基础设施和管理式 AI 服务与 NVIDIA 行业领先的平台、系统和软件相结合,我们赋予客户灵活性,以训练、调整和优化从前沿模型和开放模型到智能体 AI 及物理 AI 工作负载的各种应用——同时兼顾性能、成本和可持续性。”</span></p> <p><span style="font-weight: 400;">Google Cloud 广泛的 NVIDIA Blackwell 产品组合涵盖了从搭载 NVIDIA HGX B200 系统的 A4 虚拟机,到搭载 NVIDIA GB200 NVL72 和 A4X Max NVIDIA GB300 NVL72 系统的机架级 A4X 虚拟机,再到搭载 </span><a target="_blank" href="https://www.nvidia.com/en-us/data-center/rtx-pro-6000-blackwell-server-edition/"><span style="font-weight: 400;">NVIDIA RTX PRO 6000 Blackwell Server Edition GPU</span></a><span style="font-weight: 400;"> 的 </span><a target="_blank" href="https://cloud.google.com/blog/products/compute/google-cloud-ai-infrastructure-at-nvidia-gtc-2026#:~:text=of%20Engineering%2C%20Imgix-,Introducing%20fractional%20G4%20VMs%C2%A0,-We%20are%20excited"><span style="font-weight: 400;">部分 G4 虚拟机</span></a><span style="font-weight: 400;">。</span></p> <p><span style="font-weight: 400;">客户可以精确调整其加速能力,无论是使用互连的多个 NVL72 机架以扩展至数万个 NVIDIA Blackwell GPU,还是单个机架通过第五代 NVIDIA NVLink 和 NVLink 5 Switch 扩展至 72 个 Blackwell GPU,亦或是仅使用八分之一的 GPU。</span></p> <p><span style="font-weight: 400;">这一综合性平台帮助团队优化各类工作负载,从混合专家推理、多模态推理和数据处理,到面向物理 AI 和机器人技术下一个前沿领域的复杂模拟。</span></p> <p><span style="font-weight: 400;">领先的前沿 AI 实验室已经开始利用这一基础设施。</span><a target="_blank" href="https://www.googlecloudpresscorner.com/2026-04-22-Thinking-Machines-Expands-Use-of-NVIDIA-GPUs-through-Google-Cloud"><span style="font-weight: 400;">Thinking Machines Lab</span></a><span style="font-weight: 400;"> 正在搭载 GB300 NVL72 系统的 A4X Max 虚拟机上扩展其 Tinker 应用程序编程接口 (API),以加速训练;而 </span><a target="_blank" href="https://www.googlecloudevents.com/next-vegas/session-library?session_id=3912935&amp;name=how-openai-builds-kubernetes-gpu-clusters&amp;_gl=1*sm49ye*_up*MQ..&amp;gclid=CjwKCAjwyYPOBhBxEiwAgpT8P0jnAu2Y19tTXTZkTgC8O2I0zSOvzUi_KoaLLGWJmbIWkZShLG4MVhoCjPYQAvD_BwE&amp;gclsrc=aw.ds&amp;gbraid=0AAAAApdQcwelAABlHDeA_C2gSApVjSwSs"><span style="font-weight: 400;">OpenAI</span></a><span style="font-weight: 400;"> 则正在 Google Cloud 上利用 NVIDIA GB300(A4X Max 虚拟机)和 GB200 NVL72 系统(A4X 虚拟机)运行大规模推理任务,以支持包括 ChatGPT 在内的一些最具挑战性的推理工作负载。</span></p> <h2><b>随处安全运行 AI:主权与机密性</b></h2> <p><span style="font-weight: 400;">运行在 NVIDIA Blackwell 和 Blackwell Ultra GPU 上的 Google Gemini 模型现已在 Google Distributed Cloud 上提供 </span><a target="_blank" href="https://cloud.google.com/blog/topics/hybrid-cloud/google-distributed-cloud-at-next26"><span style="font-weight: 400;">预览版</span></a><span style="font-weight: 400;">,使客户能够将谷歌的前沿模型部署到其最敏感数据所在的任何地方。</span></p> <p><a target="_blank" href="https://www.nvidia.com/en-us/data-center/solutions/confidential-computing/"><span style="font-weight: 400;">NVIDIA 机密计算</span></a><span style="font-weight: 400;"> 结合 NVIDIA Blackwell 平台,使 Gemini 模型能够在受保护的环境中运行,确保提示词和微调数据保持加密状态,无法被包括基础设施运营商在内的未经授权的方查看或篡改。</span></p> <p><span style="font-weight: 400;">在公有云中,搭载 NVIDIA RTX PRO 6000 Blackwell GPU 的机密 G4 虚拟机 </span><a target="_blank" href="https://cloud.google.com/blog/products/identity-security/next26-redefining-security-for-the-ai-era-with-google-cloud-and-wiz"><span style="font-weight: 400;">预览版</span></a><span style="font-weight: 400;"> 将这些保护措施带到了多</span></p>
查看原文
查看缓存全文

缓存时间: 2026/05/08 07:40

# NVIDIA 与 Google Cloud 携手推进智能体 AI 与物理 AI 的发展 来源:https://blogs.nvidia.com/blog/google-cloud-agentic-physical-ai-factories/ NVIDIA 与 Google Cloud 的合作已逾十年,双方共同设计了一套覆盖所有技术层的全栈 AI 平台——从性能优化的库和框架到企业级云服务。 这一基础使得开发人员、初创企业和企业能够将智能体 AI(Agentic AI)和物理 AI(Physical AI)从实验室推向生产环境——从管理复杂工作流的智能体,到工厂车间的机器人和数字孪生系统。 在本周于拉斯维加斯举行的 Google Cloud Next 大会上,这一合作伙伴关系达到了新的里程碑,通过扩展 Google Cloud AI Hypercomputer(超级计算机)以支持 AI 工厂,为智能体 AI 和物理 AI 的下一个前沿领域提供动力。 这些进展包括:搭载全新 **NVIDIA Vera Rubin** (https://www.nvidia.com/en-us/data-center/technologies/rubin/) 的 A5X 裸金属实例;在搭载 **NVIDIA Blackwell** (https://www.nvidia.com/en-us/data-center/technologies/blackwell-architecture/) 和 NVIDIA Blackwell Ultra GPU 的 Google Distributed Cloud 上预览运行 Google Gemini;配备 NVIDIA Blackwell GPU 的机密虚拟机(Confidential VMs);以及在 Gemini Enterprise Agent Platform 上结合 **NVIDIA Nemotron** (https://www.nvidia.com/en-us/ai-data-science/foundation-models/nemotron/) 开放模型和 **NVIDIA NeMo** (https://www.nvidia.com/en-us/ai-data-science/products/nemo/) 框架打造的智能体 AI。 ## **下一代基础设施:从 NVIDIA Blackwell 到 Vera Rubin** 在 Google Cloud Next 上,Google 宣布推出由 **NVIDIA Vera Rubin NVL72** (https://www.nvidia.com/en-us/data-center/vera-rubin-nvl72/) 机架级系统驱动的 A5X 实例。通过芯片、系统和软件之间的极致协同设计,与上一代相比,其每 token 推理成本降低高达 10 倍,每兆瓦 token 吞吐量提高高达 10 倍。 A5X 将使用 **NVIDIA ConnectX-9 SuperNIC** (https://www.nvidia.com/en-us/networking/products/ethernet/supernic/),结合下一代 Google Virgo 网络技术,能够在单个站点集群中扩展至多达 **80,000** 块 NVIDIA Rubin GPU,在多站点集群中扩展至多达 **960,000** 块 NVIDIA Rubin GPU,使客户能够在 NVIDIA 优化的基础设施上运行其最大规模的 AI 工作负载。 Google Cloud AI 和计算基础设施副总裁兼总经理 Mark Lohmeyer 表示:“在 Google Cloud,我们相信未来十年的 AI 将由客户在真正集成、针对 AI 优化的基础设施堆栈上运行最具挑战性工作负载的能力所塑造。‘通过将 Google Cloud 可扩展的基础设施和托管 AI 服务与 NVIDIA 行业领先的平台、系统和软件相结合,我们赋予客户灵活性,以训练、微调和服务从前沿和开放模型到智能体和物理 AI 工作负载的各类应用——同时在性能、成本和可持续性方面实现优化。’” Google Cloud 广泛的 NVIDIA Blackwell 产品组合涵盖了从配备 NVIDIA HGX B200 系统的 A4 虚拟机,到配备 NVIDIA GB200 NVL72 和 A4X Max NVIDIA GB300 NVL72 系统的机架级 A4X 虚拟机,一直到配备 **NVIDIA RTX PRO 6000 Blackwell Server Edition GPU** (https://www.nvidia.com/en-us/data-center/rtx-pro-6000-blackwell-server-edition/) 的**分数型 G4 虚拟机** (https://cloud.google.com/blog/products/compute/google-cloud-ai-infrastructure-at-nvidia-gtc-2026#:~:text=of%20Engineering%2C%20Imgix-,Introducing%20fractional%20G4%20VMs%C2%A0,-We%20are%20excited)。 客户可以调整其加速能力规模,无论是使用多个互联的 NVL72 机架扩展至数万块 NVIDIA Blackwell GPU,还是使用单个机架通过第五代 NVIDIA NVLink 和 NVLink 5 Switch 扩展至 72 块 Blackwell GPU,亦或是仅使用八分之一块 GPU。 这一全面平台帮助团队优化各类工作负载,从混合专家(MoE)推理、多模态推理和数据处理,到面向物理 AI 和机器人技术下一个前沿领域的复杂模拟。 领先的前沿 AI 实验室已经开始部署这一基础设施。**Thinking Machines Lab** (https://www.googlecloudpresscorner.com/2026-04-22-Thinking-Machines-Expands-Use-of-NVIDIA-GPUs-through-Google-Cloud) 正在 A4X Max 虚拟机(配备 GB300 NVL72 系统)上扩展其 Tinker 应用程序编程接口(API)以加速训练,而 **OpenAI** (https://www.googlecloudevents.com/next-vegas/session-library?session_id=3912935&name=how-openai-builds-kubernetes-gpu-clusters&_gl=1*sm49ye*_up*MQ..&gclid=CjwKCAjwyYPOBhBxEiwAgpT8P0jnAu2Y19tTXTZkTgC8O2I0zSOvzUi_KoaLLGWJmbIWkZShLG4MVhoCjPYQAvD_BwE&gclsrc=aw.ds&gbraid=0AAAAApdQcwelAABlHDeA_C2gSApVjSwSs) 正在 Google Cloud 上的 NVIDIA GB300(A4X Max 虚拟机)和 GB200 NVL72 系统(A4X 虚拟机)上运行大规模推理,以处理其最苛刻的推理工作负载,包括 ChatGPT 的相关任务。 ## **AI 运行所需的任何地方都安全:主权与机密性** 运行在 NVIDIA Blackwell 和 Blackwell Ultra GPU 上的 Google Gemini 模型现已在 Google Distributed Cloud 上**预览** (https://cloud.google.com/blog/topics/hybrid-cloud/google-distributed-cloud-at-next26) 可用,使客户能够将 Google 的前沿模型带到其最敏感数据所在的位置。 搭载 NVIDIA Blackwell 平台的 **NVIDIA 机密计算** (https://www.nvidia.com/en-us/data-center/solutions/confidential-computing/) 使 Gemini 模型能够在受保护的环境中运行,其中提示词和微调数据保持加密状态,基础设施操作员等未经授权的方无法查看或篡改。 在公共云中,配备 NVIDIA RTX PRO 6000 Blackwell GPU 的 **机密 G4 虚拟机预览版** (https://cloud.google.com/blog/products/identity-security/next26-redefining-security-for-the-ai-era-with-google-cloud-and-wiz) 将这些保护引入多租户环境——帮助保护提示词、AI 模型和数据,使受监管行业的客户能够在不牺牲安全性或性能的前提下利用 AI 的强大功能。 这是云端首款支持 NVIDIA Blackwell GPU 的机密计算产品,为 Google Cloud 客户奠定了安全、高性能 AI 的新基础。 ## **用于智能体 AI 的开放模型和 API** Google Cloud 上的 NVIDIA 平台经过优化,可运行各类模型——从 Google 的前沿 Gemini 和 **Gemma** (https://developer.nvidia.com/blog/bringing-ai-closer-to-the-edge-and-on-device-with-gemma-4/) 系列,到 NVIDIA Nemotron 开放模型以及更广泛的开放权重生态系统——赋能开发人员构建能够推理、规划和行动的智能体 AI 系统。 **NVIDIA Nemotron 3** (https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models) Super 已在 Gemini Enterprise Agent Platform 上提供,为开发人员提供直接路径,以发现、定制和部署针对智能体工作负载优化的 NVIDIA 推理和多模态模型。 Google Cloud 和 NVIDIA 还在简化大规模训练和定制开放模型的过程。Gemini Enterprise Agent Platform 上的托管训练集群引入了一种新的托管强化学习(RL)API,该 API 基于 **NVIDIA NeMo RL** (https://github.com/NVIDIA-NeMo/RL) 构建,旨在加速大规模 RL 训练,同时自动化集群规模调整、故障恢复和作业执行,使团队能够专注于智能体行为和模型质量,而非基础设施管理。 网络安全领导者 **CrowdStrike** (https://www.googlecloudevents.com/next-vegas/session-library?session_id=4033904&name=accelerate-domain-ai-agents-on-google-cloud-vertex-ai-with-nvidia-nemo-and-nvidia-nemotron) 使用 **NVIDIA NeMo** (https://github.com/NVIDIA-NeMo) 开放库,如 NeMo Data Designer、NeMo Automodel 和 NeMo Megatron Bridge,生成合成数据并微调 Nemotron 及其他用于特定领域网络安全的开放大语言模型。这些能力运行在配备 NVIDIA Blackwell GPU 的 Gemini Enterprise Agent Platform 托管训练集群上,加速了威胁检测、调查和响应。 ## **构建工业与物理 AI 的未来** 大规模构建工业和物理 AI 需要强大的硬件,以及开放模型、库和框架的组合,以开发这些复杂的端到端工作流。 Google Cloud 上提供的 NVIDIA AI 基础设施、开放模型和物理 AI 库正在使工业和物理 AI 应用主流化,使客户能够模拟、优化和自动化现实世界的工作流。 来自领先工业软件提供商的解决方案,包括 **Cadence** 和 **Siemens Digital Industries Software**,现已在 Google Cloud 上提供,并由 NVIDIA AI 基础设施加速。这些应用正在推动从芯片到自动驾驶汽车、机器人、航空航天平台、重型机械和大规模生产系统等所有领域的下一代设计、工程和制造。 借助 **NVIDIA Omniverse** (https://www.nvidia.com/en-us/omniverse/) 库以及在 **Google Cloud Marketplace** (https://console.cloud.google.com/marketplace/browse?_gl=1*6u2y51*_up*MQ..*_gs*MQ..&gclid=Cj0KCQjwqPLOBhCiARIsAKRMPZoXw6AmBoY0n3Ogp2aZPgYaBvypBXygQfMyiyPjN_LCtFrOl99PP_QaApBwEALw_wcB&gclsrc=aw.ds&pli=1&rapt=AEjHL4PbiwiHdb9qi9WEmm8smGFoRJsO0_no2rD3cR5YybMNyg8tSG97i5ihTlfBK2_YjiXIV5NFPoRfgpK8Ej-_smBjtUVSYsNqxcxd6YuIzYOhyVdP9bA&q=nvidia%20omniverse) 上可用的开源 **NVIDIA Isaac Sim** (https://developer.nvidia.com/isaac/sim) 机器人模拟框架,开发人员可以构建物理上准确的数字孪生,并开发定制机器人模拟管道,在真实世界部署前对机器人进行训练、模拟和验证。 针对如 **NVIDIA Cosmos Reason 2** (https://huggingface.co/blog/nvidia/nvidia-cosmos-reason-2-brings-advanced-reasoning) 等模型的 NVIDIA NIM 微服务可部署到 Google Vertex AI 和 Google Kubernetes Engine。这使得机器人和视觉 AI 智能体能够像人类一样在物理世界中观察、推理和行动,推动自动化数据整理和标注、高级机器人规划和推理,以及用于实时洞察和决策的智能视频分析智能体等用例。 共同地,这些技术帮助开发人员无缝地从计算机辅助设计过渡到活体工业数字孪生和 AI 驱动的机器人,加速在运行于 Google Cloud 的 NVIDIA 平台上从设计签核到工厂优化的流程。 ## ** proven 影响:从初创企业到全球企业** 全球企业、AI 实验室和高增长初创企业正在利用 NVIDIA 和 Google Cloud 共同设计的平台,加快从原型到生产的进程,包括 **Snap**、**Schrödinger** 和 **Salesforce**。**Snap** (https://blogs.nvidia.com/blog/snap-accelerated-data-processing/) 通过将数据管道转移到 Google Cloud 上的 GPU 加速 Spark,降低了大规模 A/B 测试的成本。**Schrödinger** (https://www.youtube.com/watch?v=607ZZ0Zp5jo) 借助 Google Cloud 上的 NVIDIA 加速计算,将长达数周的药物发现模拟缩短至仅几小时。 初创企业正在引领下一波 AI 创新浪潮——利用 Google Cloud 上的 NVIDIA 加速计算构建新智能体和 AI 原生应用。 作为 **更广泛生态系统** (https://cloud.google.com/blog/topics/startups/startups-are-building-the-agentic-future-with-google-cloud) 的一部分,通过 **NVIDIA Inception** (https://www.nvidia.com/en-us/startups/?ncid=ref-kc-319196-vt18&sfdcid=Google) 和 Google for Startups 进行推广,**CodeRabbit** (https://www.coderabbit.ai/blog/faster-code-reviews-with-nemotron-3-super) 和 **Factory** (https://factory.ai/) 正在 Google Cloud 上使用基于 NVIDIA Nemotron 的模型来驱动代码审查和自主软件开发智能体,而 **Aible**、**Mantis AI**、**Photoroom** (https://www.photoroom.com/inside-photoroom) 和 **Baseten** 则基于 Google Cloud 上的全栈 NVIDIA 平台构建企业数据、视频智能、生成式图像和托管推理解决方案。 在短短一年多的时间里,已有超过 90,000 名开发人员加入联合 **NVIDIA 和 Google Cloud 开发者社区** (https://developers.google.com/community/nvidia?utm_source=linkedin&utm_medium=unpaidsoc&utm_campaign=fy25q2-googlecloud-blog-ai-in_feed-no-brand-global&utm_content=-&utm_term=-&linkId=14552521),利用这一平台构建和扩展新的 AI 应用。 此外,NVIDIA 在 Next 大会上荣获两项 **Google Cloud 年度合作伙伴** (https://cloud.google.com/blog/topics/partners/2026-partners-of-the-year-winners-next26) 称号——AI 全球技术合作伙伴和基础设施现代化计算,以表彰其深厚的技术专长和市场拓展的一致性。 NVIDIA 和 Google Cloud 共同为客户提供云规模平台,将实验性智能体和模拟转化为生产系统,从而审查代码、保护车队、启用新的 AI 应用并在现实世界中优化工厂。 *通过参加 Google Cloud Next 上的* **NVIDIA 会议、演示和研讨会** (https://www.nvidia.com/en-us/events/google-cloud-next/)*,了解更多关于两家公司合作的信息。*

相似文章

HPE与NVIDIA的AI工厂面向智能体时代扩展

NVIDIA Blog

NVIDIA与HPE正在扩展其AI工厂合作,推出用于智能体AI的NVIDIA Vera CPU、用于HPE Private Cloud AI的NVIDIA Agent Toolkit,以及在整个产品组合中部署NVIDIA机密计算,助力企业将智能体AI投入生产。

NVIDIA 与 Google Cloud 赋能新一代 AI 开发者

NVIDIA Blog

NVIDIA 与 Google Cloud 在 Google I/O 上宣布了针对双方联合开发者社区的新学习路径、Codelabs 和直播活动,旨在帮助 AI 构建者利用 JAX、NVIDIA Dynamo 和 Gemma 4 等工具,在 Google Cloud 上使用 NVIDIA AI 平台。