NVIDIA 在 RTX PC 和 DGX Spark 上全面升级本地 AI 智能体

NVIDIA Blog 2026/06/01 04:30 产品

nvidia ai-agents local-ai rtx windows on-device dgx

摘要

NVIDIA 发布了 RTX Spark PC 和一系列更新，以在 RTX 和 DGX 生态系统中支持本地 AI 智能体，包括 OpenShell 运行时即将登陆 Windows、NemoClaw 扩展、性能提升以及与 Adobe 和 H Company 的集成。

<div id="bsf_rt_marker"></div>个人智能体正迅速流行起来，像 OpenClaw 和 Hermes 这样的开源项目在 GitHub 上的 AI 开发者社区中被广泛采用。这些智能体专为适应用户个人偏好和工作流程而设计，能够与应用程序交互、生成内容、自动化重复流程并管理多步骤任务——所有操作均在设备本地运行。 今天在 <a target="_blank" href="https://www.nvidia.com/en-tw/gtc/taipei/">COMPUTEX 的 NVIDIA GTC 台北站</a>上，NVIDIA 推出了 <a target="_blank" href="https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-spark">NVIDIA RTX Spark</a>——一款专为个人智能体打造的新型 Windows PC，同时发布了一系列更新，将本地智能体扩展到更广泛的 NVIDIA RTX 和 DGX 生态系统。 要安全且私密地运行智能体，需要足够强大的硬件。RTX Spark 提供 1 petaflop 的 AI 算力和 128GB 统一内存，能够满足设备端智能体的计算需求，带来一种从工具到协作者的新型计算机。RTX Spark 专为 AI、创作和游戏而设计，将 NVIDIA 30 年的技术创新融入续航一整天的轻薄 Windows 笔记本和超高效台式机中。 NVIDIA 与 Windows 的合作涵盖了从个人到企业级解决方案。此次展会还推出了 <a target="_blank" href="https://www.nvidia.com/en-us/products/workstations/dgx-station-for-windows/">NVIDIA DGX Station for Windows</a>，这是面向专业人士的终极 AI 桌面超级计算机，将数据中心级的 GPU 和 CPU 集成到配备 Windows 的桌面系统中，提供可管理性、安全性和兼容性。 其他公告包括： <ul> <li> <a target="_blank" href="https://build.nvidia.com/openshell?ncid=pa-srch-goog-984177">NVIDIA OpenShell</a> 运行时即将登陆 Windows，基于 Microsoft 新的智能体安全基元构建——为开发者提供易于部署的软件包，用于安全的设备端智能体。 Hermes Agent 和 OpenClaw 也将在其新的 Windows 应用程序中集成 OpenShell 和 Microsoft 安全基元。</li> <li> <a target="_blank" href="https://www.nvidia.com/en-us/ai/nemoclaw/">NVIDIA NemoClaw</a> 蓝图正在扩展到 NVIDIA 完整的本地 AI 产品线——GeForce RTX、RTX PRO、RTX 和 DGX Spark、以及 DGX Station——新增了简化安装程序和对 Hermes Agent 的支持。</li> <li>通过在 llama.cpp 和 vLLM 中启用多 token 预测，主要智能体模型的推理性能翻倍；同时为 llama.cpp 和 ComfyUI 新增了多 GPU 优化。</li> <li>H Company 推出了计算机使用工具——包括新模型和即将推出的桌面智能体框架——针对 RTX 和 DGX PC 进行了优化。</li> <li>Adobe 正在重新架构其 Photoshop 和 Premiere 应用程序，Blender 新增了 NVIDIA DLSS 4.5 光线重建，NVIDIA 还推出了 RTX 视频帧生成，即将登陆 ComfyUI。所有这些更新将于今年秋季随 RTX Spark 一同到来。</li> <li>NVIDIA Broadcast 2.2 更新带来了 Studio Voice 功能优化和 Elgato Stream Deck 支持。NVIDIA Project G-Assist 也新增了 Stream Deck 集成。</li> </ul> <h2>本地智能体 AI：在 Windows RTX PC 上实现个性化、私密、快速</h2> 智能体的大规模采用一直受限于无法在用户主要 PC 上安全且私密地运行。 NVIDIA 和 Microsoft 正携手应对这一挑战，为设备端智能体提供强大且安全的 Windows 平台。 此次合作始于坚实的基础——新的 Windows 安全基元和 NVIDIA OpenShell 运行时——确保智能体在完全受用户控制的情况下安全运行。 新的 Windows 基元提供了身份、隔离、策略和端到端安全能力，用于原生构建和运行智能体。NVIDIA OpenShell 提供了额外的策略能力，允许用户定义智能体能做什么和不能做什么，能够根据用户隐私策略智能地将查询路由到本地模型，并能在发送到云端模型的查询中隐藏个人信息。 这一强大的安全和隐私层正被 Hermes Agent 和 OpenClaw 等领先智能体开发者在其新的 Windows 应用中所采用。这些新应用将使用户能够轻松、安全地访问强大的设备端智能体，这些智能体可以在 Windows 应用程序中执行任务、推理跨应用工作流、生成图像和视频、编写插件和应用程序，并对本地文件进行语义搜索。 在本地设备上驱动智能体既需要强大的安全性，也需要高性能的硬件。RTX Spark 提供高达 1 petaflop 的 AI 算力和 128GB 统一内存，以满足设备端智能体的处理需求。 NVIDIA 还在加速这些智能体所依赖的本地开放模型生态系统。 NVIDIA 与 llama.cpp 社区合作，启用了诸如多 token 预测 (MTP) 等功能和优化——这是一种推测解码技术，小型草稿模型一次提出多个 token，目标模型在一次传递中进行验证。结合其他优化（如程序化依赖启动），在 Qwen 3.6 和 3.5 27B 上实现了 2 倍性能提升，在 Qwen 3.6 和 3.5 35B 上实现了 1.6 倍性能提升。这些更新可通过 llama.cpp webUI 和 LM Studio 获取。 <figure id="attachment_93554" aria-describedby="caption-attachment-93554" style="width: 1200px" class="wp-caption aligncenter"><a href="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-Performance-1-scaled.png"><img loading="lazy" decoding="async" class="size-large wp-image-93554" src="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-Performance-1-1680x838.png" alt="" width="1200" height="599" srcset="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-” width="1200" height="599" srcset="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-Performance-1-1680x838.png 1680w, ..."><figcaption id="caption-attachment-93554" class="wp-caption-text">llama.cpp 性能提升示意图</figcaption></figure>

查看原文

查看缓存全文

缓存时间: 2026/06/01 09:24

# NVIDIA 升级本地 AI 代理，覆盖 RTX PC 和 DGX Spark 随着 OpenClaw 和 Hermes 等开源项目在 GitHub 上的 AI 开发者社区中迅速普及，个人代理正迎来爆发式增长。这些代理专为适应个人偏好和工作流程而设计，能够与应用程序交互、生成内容、自动化重复流程并管理多步骤任务——所有操作均在设备本地运行。今天在 COMPUTEX 台北的 NVIDIA GTC Taipei 上，NVIDIA 发布了 **NVIDIA RTX Spark**——一类专为个人代理打造的新型 Windows PC——同时带来了一系列更新，将本地代理扩展至更广泛的 NVIDIA RTX 和 DGX 生态系统。要安全且私密地运行代理，需要硬件能够胜任。RTX Spark 拥有 1 petaflop 的 AI 算力和 128GB 统一内存，能够满足设备端代理的计算需求，提供了一类从工具转变为队友的新型计算机。专为 AI、创作和游戏设计，RTX Spark 将 NVIDIA 30 年的技术创新融入具有全天续航的轻薄 Windows 笔记本电脑和超高效台式机中。 NVIDIA 与 Windows 的合作从个人解决方案扩展到企业解决方案。同期推出的还有 **NVIDIA DGX Station for Windows**，这是面向专业人士的终极 AI 桌面超级计算机，将数据中心级 GPU 和 CPU 引入桌面系统，并配备 Windows 以实现可管理性、安全性和兼容性。其他公告包括： - **NVIDIA OpenShell** 运行时即将登陆 **Windows**，基于 **Microsoft** 为代理构建的全新安全基元——为开发者提供易于部署的安全设备端代理包。**Hermes Agent** 和 **OpenClaw** 也将在其新的 Windows 应用程序中集成 OpenShell 和 Microsoft 安全基元。 - **NVIDIA NemoClaw** 蓝图正在扩展到 NVIDIA 完整的本地 AI 产品线——GeForce RTX、RTX PRO、RTX 和 DGX Spark、DGX Station——并配备新的简化安装程序和对 Hermes Agent 的支持。 - 通过 llama.cpp 和 vLLM 中的多令牌预测，顶级代理模型获得 2 倍推理性能提升，同时为 llama.cpp 和 ComfyUI 带来新的多 GPU 优化。 - **H Company** 正在发布计算机使用工具——包括新模型和即将推出的桌面代理框架——为 RTX 和 DGX PC 进行优化。 - **Adobe** 正在重构其 Photoshop 和 Premiere 应用程序，**Blender** 将添加 NVIDIA **DLSS 4.5 Ray Reconstruction**，NVIDIA 还推出了 RTX Video Frame Generation，即将登陆 ComfyUI。所有这些更新将于今年秋季随 RTX Spark 一同到来。 - **NVIDIA Broadcast 2.2** 更新带来了 Studio Voice 功能优化和 **Elgato Stream Deck** 支持。**NVIDIA Project G-Assist** 也增加了 **Stream Deck** 集成。 ## **本地代理 AI：在 Windows RTX PC 上实现个人化、私密且快速** 广泛采用代理一直受到限制，因为无法在用户的主 PC 上安全且私密地运行代理。 NVIDIA 和 Microsoft 正在合作应对这一挑战，为设备端代理提供一个强大、安全的 Windows 平台。此次合作始于一个坚实的基础——新的 Windows 安全基元和 NVIDIA OpenShell 运行时——以确保代理在完全用户控制下安全运行。新的 Windows 基元提供了身份、隔离、策略和端到端安全能力，以便原生构建和运行代理。NVIDIA OpenShell 提供了额外的策略能力，让用户可以定义代理能做什么和不能做什么，能够根据用户的隐私策略智能地将查询路由到本地模型，并且能够在发送到云模型的查询中隐藏个人信息。这一强大的安全与隐私层正被领先的代理开发者（如 Hermes Agent 和 OpenClaw）在其新的 Windows 应用程序中采用。这些新应用程序将使用户能够轻松、安全地访问强大的设备端代理，这些代理可以在 Windows 应用程序中执行任务、推理跨应用工作流、生成图像和视频、编写插件和应用程序，以及语义搜索本地文件。在本地设备上驱动代理需要强大的安全性和高性能硬件。RTX Spark 拥有高达 1 petaflop 的 AI 算力和 128GB 统一内存，以满足设备端代理的处理需求。 NVIDIA 还加速了这些代理所依赖的本地开放模型生态系统。 NVIDIA 与 **llama.cpp** 社区合作，启用了多项功能和优化，例如多令牌预测（MTP）——一种推测解码技术，其中较小的草稿模型一次提出多个令牌，由目标模型在一次传递中验证。结合其他优化（如程序化依赖启动），这为 Qwen 3.6 和 3.5 27B 带来了 2 倍性能提升，为 Qwen 3.6 和 3.5 35B 带来了 1.6 倍性能提升。这些更新可通过 llama.cpp webUI 和 LM Studio 获取。 [图：llama.cpp 性能提升图] 展示了使用最新 NVIDIA 优化后的 llama.cpp 性能提升：在 GeForce RTX 5090 上，Qwen3.6-27B 吞吐量最高提升 2 倍，Qwen3.6-35B 最高提升 1.6 倍，通过开源社区合作加速本地代理 AI 工作负载。对于运行多 GPU 平台的 AI 爱好者，NVIDIA 与开源社区合作增强了两款最流行的本地 AI 工具： - **llama.cpp** 增加了张量并行，在两块相同 GPU 上可实现最高 2 倍内存和 1.8 倍计算性能。 - **ComfyUI** 获得了新的无分类器引导方法，在两块相同 GPU 上性能最高提升 2 倍，并且可以选择跨 GPU 拆分模型链以利用组合内存。 [图：多 GPU LLM 性能比较图] 显示了在 llama.cpp 上，张量并行多 GPU 技术相对于流水线并行和单 GPU 推理的令牌生成性能改进。 [图：多 GPU 创作 AI 性能图] 显示了在 ComfyUI 上，多 GPU 技术的生成时间性能改进。 NVIDIA 还与 **H Company** 扩展了代理能力。H Company 的计算机使用框架让代理能够通过查看屏幕和操作鼠标键盘来导航 PC，就像用户一样，甚至在没有 API 的应用程序中也能工作，即将在 RTX 和 DGX PC 上推出，并支持本地模型。 NVIDIA 与 H Company 合作，对其最先进的 Holo Computer Use 模型进行了量化，并加速了其框架——在 NVIDIA GPU 上实现 2 倍加速，同时将内存消耗降低 35%。这些模型现已可供下载，Holo Desktop 应用即将推出。 ## **面向 Linux 的代理优化** 对于需要始终可访问的本地代理的开发者而言，NVIDIA DGX Spark 是最强大的个人代理 AI 计算机，尤其适合需要 Linux 环境的开发者——统一了大内存、快速计算以及与 NVIDIA CUDA 生态系统的兼容性。本月的 DGX Spark 操作系统版本带来了最简化的开箱即用体验，配备简化的 NemoClaw 安装程序，以及在顶级代理模型上提供更快的推理性能。 NemoClaw 现已适用于所有在 Linux 和 Windows Subsystem for Linux 上的 NVIDIA RTX 和 DGX PC。使用新的简化安装程序，在 Linux 上安全部署本地代理，提供自动沙箱和对 Hermes Agent 的额外支持。 NVIDIA 与 **vLLM** 合作优化了代理推理，在 vLLM 中进行了优化，并为 Qwen 3.6 35B 提供了新的优化 NVFP4 检查点。这些更新使 DGX Spark 的性能比之前 Unsloth 提供的 NVFP4 检查点提升了 2.6 倍，并包括内核改进、混合精度以及 CUDA Graph 对 MTP 的支持。阅读 vLLM 博客，获取在 DGX Spark 上服务 NVFP4 混合专家模型的完整指南——从统一内存调优到可工作的 NVIDIA Nemotron 3 Super 参考设置。 ## **与 Adobe 携手提供强大的创作体验** NVIDIA 正在与 Adobe 合作，为 RTX Spark 重构 Adobe Premiere 和 Photoshop。Photoshop 中由 Firefly 驱动的生成式填充和 Premiere 中的生成式扩展，是数百个加速工具中的一部分，提供了创作力量、精确性和控制力。RTX Spark 进一步提升了这些能力，在创意工作流程中实现最高 2 倍的 AI、编辑、调色和特效性能。 Adobe Premiere 将采用全新的视频管线，利用 RTX Spark 的统一内存、Blackwell GPU 和 TensorRT 软件，为编辑和色彩校正提供实时性能、GPU 加速的 AI 性能以及更高效地渲染复杂时间线。此外，Adobe 的 Substance 3D Painter 和 Stager 将在 RTX Spark 上原生运行，实现更流畅、响应更快的 3D 纹理和场景创建工作流程。 Adobe 的下一代 Photoshop 引擎将针对 GPU 加速合成进行优化，支持实时滤镜、高动态范围和现代自然笔刷。基于 AI 原生的管线旨在充分利用 RTX Spark 的全部力量，包括 TensorRT。 Adobe 将进一步扩展 Premiere 和 Photoshop，允许用户通过 Windows 代理进行创建、编辑和设计，为创作者提供一个协作伙伴，加速其工作流程。 Adobe 创意应用（如 Premiere、Photoshop 和 Substance）的更新预计将与 RTX Spark 的上市同步推出。 ## **面向创作者的新工具和应用更新** 新的 NVIDIA 平台更新和合作伙伴应用优化正在整个 RTX 生态系统中推出——部分今天即上线，其余将于今年秋季随 RTX Spark 一同到来。 NVIDIA Broadcast 2.2 将 Studio Voice（一项让任何麦克风都能发出录音室级音质的 AI 功能）从测试版毕业。Studio Voice 即日起可在 GeForce RTX 3060 及以上 GPU 上运行，性能更佳。该应用还获得了 Elgato Stream Deck 集成和可配置键盘快捷键。通过 Elgato MCP 服务器，Project G-Assist 也增加了 Stream Deck 支持，让用户能够为其流媒体设置启用 AI 助手功能。此外，Blender Cycles 正在集成 DLSS 4.5 Ray Reconstruction 作为新的降噪器，将路径追踪视口转变为交互式实时查看器。这使 3D 艺术家可以在场景中导航，同时看到接近最终渲染的质量，彻底改变照明和外观开发工作流程。该更新将于今年秋季随 RTX Spark 一同在 Blender 5.3 中发布。同样随 RTX Spark 推出的还有 RTX Video Frame Generation，这是一种新的 AI 效果，可实时将视频帧率提高一倍或四倍——非常适合增强 AI 模型通常生成的 15-20 帧/秒（fps）输出。它以 Python wheel 和 ComfyUI 节点形式提供，让 AI 艺术家可以在低帧率下更快生成视频，然后插值到流畅的播放速率。 ## **#ICYMI: RTX AI Garage 最新动态** 🪐 **阅读完整的 NVIDIA RTX Spark 公告**，了解超级芯片、NVIDIA 与 Windows 在代理方面的合作，以及合作伙伴笔记本电脑和小型台式机的详细信息。 💻 **ASUS ProArt 创作者笔记本电脑现已预装 Black Forest Labs 的 FLUX.2 Klein 4B**——一款通过 MuseTree 应用预装的蒸馏图像模型，采用 NVFP4 格式和 NVIDIA TensorRT for RTX 软件开发套件优化。创作者可获得高达 2.5 倍的加速和 560% 的内存减少，首次开箱即可直接在本地生成图像——无需下载模型或设置 ComfyUI。 🎬 **NVIDIA AI for Media 软件开发套件引入了多项更新**，包括针对法语、德语和西班牙语优化的新 LipSync NVIDIA NIM 微服务。Active Speaker Detection NIM 微服务还增加了多摄像头支持，具备跨视频发言人关联功能。 🤖 **查看关于 Hermes Agent 的最新 RTX AI Garage 博客文章**，了解 RTX PC 和 DGX Spark 上的自我改进 AI。 *在 Facebook、Instagram、TikTok 和 X 上关注 RTX Spark——并通过订阅 RTX Spark 新闻简报保持信息更新。* *请参阅关于软件产品信息的通知。*

NVIDIA 在 RTX PC 和 DGX Spark 上全面升级本地 AI 智能体

相似文章

从 RTX 到 Spark：NVIDIA 加速 Gemma 4 赋能本地智能体 AI

NVIDIA与微软合作推出智能体AI部署统一技术栈，覆盖Windows设备、云及本地环境

Nvidia瞄准2000亿美元CPU市场，与微软、戴尔、惠普合作推出AI代理PC

@Saboo_Shubham_: 到2026年底，每个人都能在自己的电脑上运行一支AI代理团队。配备128GB统一内存的NVIDIA RTX Spark就是为此而生。

首个完全自主的LLM代理网络攻击被记录……NVIDIA与微软发布“RTX Spark”超级芯片

提交意见反馈