NVIDIA 在 RTX PC 和 DGX Spark 上全面升级本地 AI 智能体
摘要
NVIDIA 发布了 RTX Spark PC 和一系列更新,以在 RTX 和 DGX 生态系统中支持本地 AI 智能体,包括 OpenShell 运行时即将登陆 Windows、NemoClaw 扩展、性能提升以及与 Adobe 和 H Company 的集成。
<div id="bsf_rt_marker"></div><p><span style="font-weight: 400">个人智能体正迅速流行起来,像 OpenClaw 和 Hermes 这样的开源项目在 GitHub 上的 AI 开发者社区中被广泛采用。这些智能体专为适应用户个人偏好和工作流程而设计,能够与应用程序交互、生成内容、自动化重复流程并管理多步骤任务——所有操作均在设备本地运行。</span></p>
<p><span style="font-weight: 400">今天在 </span><a target="_blank" href="https://www.nvidia.com/en-tw/gtc/taipei/"><span style="font-weight: 400">COMPUTEX 的 NVIDIA GTC 台北站</span></a><span style="font-weight: 400">上,NVIDIA 推出了 </span><a target="_blank" href="https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-spark"><span style="font-weight: 400">NVIDIA RTX Spark</span></a><span style="font-weight: 400">——一款专为个人智能体打造的新型 Windows PC,同时发布了一系列更新,将本地智能体扩展到更广泛的 NVIDIA RTX 和 DGX 生态系统。</span></p>
<p><span style="font-weight: 400">要安全且私密地运行智能体,需要足够强大的硬件。RTX Spark 提供 1 petaflop 的 AI 算力和 128GB 统一内存,能够满足设备端智能体的计算需求,带来一种从工具到协作者的新型计算机。RTX Spark 专为 AI、创作和游戏而设计,将 NVIDIA 30 年的技术创新融入续航一整天的轻薄 Windows 笔记本和超高效台式机中。</span></p>
<p><span style="font-weight: 400">NVIDIA 与 Windows 的合作涵盖了从个人到企业级解决方案。此次展会还推出了 <a target="_blank" href="https://www.nvidia.com/en-us/products/workstations/dgx-station-for-windows/">NVIDIA DGX Station for Windows</a>,</span><span style="font-weight: 400">这是面向专业人士的终极 AI 桌面超级计算机,将数据中心级的 GPU 和 CPU 集成到配备 Windows 的桌面系统中,提供可管理性、安全性和兼容性。</span></p>
<p><span style="font-weight: 400">其他公告包括</span><b>:</b></p>
<ul>
<li><span style="font-weight: 400"> </span><a target="_blank" href="https://build.nvidia.com/openshell?ncid=pa-srch-goog-984177"><span style="font-weight: 400">NVIDIA OpenShell</span></a><span style="font-weight: 400"> 运行时即将登陆 </span><span style="font-weight: 400">Windows</span><span style="font-weight: 400">,基于 </span><span style="font-weight: 400">Microsoft</span><span style="font-weight: 400"> 新的智能体安全基元构建——为开发者提供易于部署的软件包,用于安全的设备端智能体。</span><span style="font-weight: 400"> Hermes Agent</span><span style="font-weight: 400"> 和 </span><span style="font-weight: 400">OpenClaw </span><span style="font-weight: 400">也将在其新的 Windows 应用程序中集成 OpenShell 和 Microsoft 安全基元。</span></li>
<li><span style="font-weight: 400"> </span><a target="_blank" href="https://www.nvidia.com/en-us/ai/nemoclaw/"><span style="font-weight: 400">NVIDIA NemoClaw</span></a><span style="font-weight: 400"> 蓝图正在扩展到 NVIDIA 完整的本地 AI 产品线——GeForce RTX、RTX PRO、RTX 和 DGX Spark、以及 DGX Station——新增了简化安装程序和对 Hermes Agent 的支持。</span></li>
<li><span style="font-weight: 400">通过在 llama.cpp 和 </span><span style="font-weight: 400">vLLM 中启用多 token 预测,主要智能体模型的推理性能翻倍;同时为 </span><span style="font-weight: 400">llama.cpp 和 ComfyUI 新增了多 GPU 优化。</span></li>
<li><span style="font-weight: 400">H Company 推出了计算机使用工具——包括新模型和即将推出的桌面智能体框架——针对 RTX 和 DGX PC 进行了优化。</span></li>
<li><span style="font-weight: 400">Adobe</span><span style="font-weight: 400"> 正在重新架构其 Photoshop 和 Premiere 应用程序,</span><span style="font-weight: 400">Blender 新增了 NVIDIA </span><span style="font-weight: 400">DLSS 4.5 光线重建,NVIDIA 还推出了 RTX 视频帧生成,即将登陆 ComfyUI。所有这些更新将于今年秋季随 RTX Spark 一同到来。</span></li>
<li><span style="font-weight: 400">NVIDIA Broadcast 2.2 更新带来了 Studio Voice 功能优化和 </span><span style="font-weight: 400">Elgato Stream Deck </span><span style="font-weight: 400">支持。NVIDIA Project G-Assist 也新增了 </span><span style="font-weight: 400">Stream Deck </span><span style="font-weight: 400">集成。</span></li>
</ul>
<h2><b>本地智能体 AI:在 Windows RTX PC 上实现个性化、私密、快速</b></h2>
<p><span style="font-weight: 400">智能体的大规模采用一直受限于无法在用户主要 PC 上安全且私密地运行。</span></p>
<p><span style="font-weight: 400">NVIDIA 和 Microsoft 正携手应对这一挑战,为设备端智能体提供强大且安全的 Windows 平台。</span></p>
<p><span style="font-weight: 400">此次合作始于坚实的基础——新的 Windows 安全基元和 NVIDIA OpenShell 运行时——确保智能体在完全受用户控制的情况下安全运行。</span></p>
<p><span style="font-weight: 400">新的 Windows 基元提供了身份、隔离、策略和端到端安全能力,用于原生构建和运行智能体。NVIDIA OpenShell 提供了额外的策略能力,允许用户定义智能体能做什么和不能做什么,能够根据用户隐私策略智能地将查询路由到本地模型,并能在发送到云端模型的查询中隐藏个人信息。</span></p>
<p><span style="font-weight: 400">这一强大的安全和隐私层正被 Hermes Agent 和 OpenClaw 等领先智能体开发者在其新的 Windows 应用中所采用。这些新应用将使用户能够轻松、安全地访问强大的设备端智能体,这些智能体可以在 Windows 应用程序中执行任务、推理跨应用工作流、生成图像和视频、编写插件和应用程序,并对本地文件进行语义搜索。</span></p>
<p><span style="font-weight: 400">在本地设备上驱动智能体既需要强大的安全性,也需要高性能的硬件。RTX Spark 提供高达 1 petaflop 的 AI 算力和 128GB 统一内存,以满足设备端智能体的处理需求。</span></p>
<p><span style="font-weight: 400">NVIDIA 还在加速这些智能体所依赖的本地开放模型生态系统。</span></p>
<p><span style="font-weight: 400">NVIDIA 与 </span><span style="font-weight: 400">llama.cpp</span><span style="font-weight: 400"> 社区合作,启用了诸如多 token 预测 (MTP) 等功能和优化——这是一种推测解码技术,小型草稿模型一次提出多个 token,目标模型在一次传递中进行验证。结合其他优化(如程序化依赖启动),在 Qwen 3.6 和 3.5 27B 上实现了 2 倍性能提升,在 Qwen 3.6 和 3.5 35B 上实现了 1.6 倍性能提升。这些更新可通过 </span><span style="font-weight: 400">llama.cpp </span><span style="font-weight: 400">webUI 和 </span><span style="font-weight: 400">LM Studio </span><span style="font-weight: 400">获取。</span></p>
<figure id="attachment_93554" aria-describedby="caption-attachment-93554" style="width: 1200px" class="wp-caption aligncenter"><a href="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-Performance-1-scaled.png"><img loading="lazy" decoding="async" class="size-large wp-image-93554" src="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-Performance-1-1680x838.png" alt="" width="1200" height="599" srcset="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-” width="1200" height="599" srcset="https://blogs.nvidia.com/wp-content/uploads/2026/05/Llama.cpp-Performance-1-1680x838.png 1680w, ..."><figcaption id="caption-attachment-93554" class="wp-caption-text">llama.cpp 性能提升示意图</figcaption></figure>
查看缓存全文
缓存时间: 2026/06/01 09:24
# NVIDIA 升级本地 AI 代理,覆盖 RTX PC 和 DGX Spark
随着 OpenClaw 和 Hermes 等开源项目在 GitHub 上的 AI 开发者社区中迅速普及,个人代理正迎来爆发式增长。这些代理专为适应个人偏好和工作流程而设计,能够与应用程序交互、生成内容、自动化重复流程并管理多步骤任务——所有操作均在设备本地运行。
今天在 COMPUTEX 台北的 NVIDIA GTC Taipei 上,NVIDIA 发布了 **NVIDIA RTX Spark**——一类专为个人代理打造的新型 Windows PC——同时带来了一系列更新,将本地代理扩展至更广泛的 NVIDIA RTX 和 DGX 生态系统。
要安全且私密地运行代理,需要硬件能够胜任。RTX Spark 拥有 1 petaflop 的 AI 算力和 128GB 统一内存,能够满足设备端代理的计算需求,提供了一类从工具转变为队友的新型计算机。专为 AI、创作和游戏设计,RTX Spark 将 NVIDIA 30 年的技术创新融入具有全天续航的轻薄 Windows 笔记本电脑和超高效台式机中。
NVIDIA 与 Windows 的合作从个人解决方案扩展到企业解决方案。同期推出的还有 **NVIDIA DGX Station for Windows**,这是面向专业人士的终极 AI 桌面超级计算机,将数据中心级 GPU 和 CPU 引入桌面系统,并配备 Windows 以实现可管理性、安全性和兼容性。
其他公告包括:
- **NVIDIA OpenShell** 运行时即将登陆 **Windows**,基于 **Microsoft** 为代理构建的全新安全基元——为开发者提供易于部署的安全设备端代理包。**Hermes Agent** 和 **OpenClaw** 也将在其新的 Windows 应用程序中集成 OpenShell 和 Microsoft 安全基元。
- **NVIDIA NemoClaw** 蓝图正在扩展到 NVIDIA 完整的本地 AI 产品线——GeForce RTX、RTX PRO、RTX 和 DGX Spark、DGX Station——并配备新的简化安装程序和对 Hermes Agent 的支持。
- 通过 llama.cpp 和 vLLM 中的多令牌预测,顶级代理模型获得 2 倍推理性能提升,同时为 llama.cpp 和 ComfyUI 带来新的多 GPU 优化。
- **H Company** 正在发布计算机使用工具——包括新模型和即将推出的桌面代理框架——为 RTX 和 DGX PC 进行优化。
- **Adobe** 正在重构其 Photoshop 和 Premiere 应用程序,**Blender** 将添加 NVIDIA **DLSS 4.5 Ray Reconstruction**,NVIDIA 还推出了 RTX Video Frame Generation,即将登陆 ComfyUI。所有这些更新将于今年秋季随 RTX Spark 一同到来。
- **NVIDIA Broadcast 2.2** 更新带来了 Studio Voice 功能优化和 **Elgato Stream Deck** 支持。**NVIDIA Project G-Assist** 也增加了 **Stream Deck** 集成。
## **本地代理 AI:在 Windows RTX PC 上实现个人化、私密且快速**
广泛采用代理一直受到限制,因为无法在用户的主 PC 上安全且私密地运行代理。
NVIDIA 和 Microsoft 正在合作应对这一挑战,为设备端代理提供一个强大、安全的 Windows 平台。
此次合作始于一个坚实的基础——新的 Windows 安全基元和 NVIDIA OpenShell 运行时——以确保代理在完全用户控制下安全运行。
新的 Windows 基元提供了身份、隔离、策略和端到端安全能力,以便原生构建和运行代理。NVIDIA OpenShell 提供了额外的策略能力,让用户可以定义代理能做什么和不能做什么,能够根据用户的隐私策略智能地将查询路由到本地模型,并且能够在发送到云模型的查询中隐藏个人信息。
这一强大的安全与隐私层正被领先的代理开发者(如 Hermes Agent 和 OpenClaw)在其新的 Windows 应用程序中采用。这些新应用程序将使用户能够轻松、安全地访问强大的设备端代理,这些代理可以在 Windows 应用程序中执行任务、推理跨应用工作流、生成图像和视频、编写插件和应用程序,以及语义搜索本地文件。
在本地设备上驱动代理需要强大的安全性和高性能硬件。RTX Spark 拥有高达 1 petaflop 的 AI 算力和 128GB 统一内存,以满足设备端代理的处理需求。
NVIDIA 还加速了这些代理所依赖的本地开放模型生态系统。
NVIDIA 与 **llama.cpp** 社区合作,启用了多项功能和优化,例如多令牌预测(MTP)——一种推测解码技术,其中较小的草稿模型一次提出多个令牌,由目标模型在一次传递中验证。结合其他优化(如程序化依赖启动),这为 Qwen 3.6 和 3.5 27B 带来了 2 倍性能提升,为 Qwen 3.6 和 3.5 35B 带来了 1.6 倍性能提升。这些更新可通过 llama.cpp webUI 和 LM Studio 获取。
[图:llama.cpp 性能提升图]
展示了使用最新 NVIDIA 优化后的 llama.cpp 性能提升:在 GeForce RTX 5090 上,Qwen3.6-27B 吞吐量最高提升 2 倍,Qwen3.6-35B 最高提升 1.6 倍,通过开源社区合作加速本地代理 AI 工作负载。
对于运行多 GPU 平台的 AI 爱好者,NVIDIA 与开源社区合作增强了两款最流行的本地 AI 工具:
- **llama.cpp** 增加了张量并行,在两块相同 GPU 上可实现最高 2 倍内存和 1.8 倍计算性能。
- **ComfyUI** 获得了新的无分类器引导方法,在两块相同 GPU 上性能最高提升 2 倍,并且可以选择跨 GPU 拆分模型链以利用组合内存。
[图:多 GPU LLM 性能比较图]
显示了在 llama.cpp 上,张量并行多 GPU 技术相对于流水线并行和单 GPU 推理的令牌生成性能改进。
[图:多 GPU 创作 AI 性能图]
显示了在 ComfyUI 上,多 GPU 技术的生成时间性能改进。
NVIDIA 还与 **H Company** 扩展了代理能力。H Company 的计算机使用框架让代理能够通过查看屏幕和操作鼠标键盘来导航 PC,就像用户一样,甚至在没有 API 的应用程序中也能工作,即将在 RTX 和 DGX PC 上推出,并支持本地模型。
NVIDIA 与 H Company 合作,对其最先进的 Holo Computer Use 模型进行了量化,并加速了其框架——在 NVIDIA GPU 上实现 2 倍加速,同时将内存消耗降低 35%。这些模型现已可供下载,Holo Desktop 应用即将推出。
## **面向 Linux 的代理优化**
对于需要始终可访问的本地代理的开发者而言,NVIDIA DGX Spark 是最强大的个人代理 AI 计算机,尤其适合需要 Linux 环境的开发者——统一了大内存、快速计算以及与 NVIDIA CUDA 生态系统的兼容性。
本月的 DGX Spark 操作系统版本带来了最简化的开箱即用体验,配备简化的 NemoClaw 安装程序,以及在顶级代理模型上提供更快的推理性能。
NemoClaw 现已适用于所有在 Linux 和 Windows Subsystem for Linux 上的 NVIDIA RTX 和 DGX PC。使用新的简化安装程序,在 Linux 上安全部署本地代理,提供自动沙箱和对 Hermes Agent 的额外支持。
NVIDIA 与 **vLLM** 合作优化了代理推理,在 vLLM 中进行了优化,并为 Qwen 3.6 35B 提供了新的优化 NVFP4 检查点。这些更新使 DGX Spark 的性能比之前 Unsloth 提供的 NVFP4 检查点提升了 2.6 倍,并包括内核改进、混合精度以及 CUDA Graph 对 MTP 的支持。
阅读 vLLM 博客,获取在 DGX Spark 上服务 NVFP4 混合专家模型的完整指南——从统一内存调优到可工作的 NVIDIA Nemotron 3 Super 参考设置。
## **与 Adobe 携手提供强大的创作体验**
NVIDIA 正在与 Adobe 合作,为 RTX Spark 重构 Adobe Premiere 和 Photoshop。Photoshop 中由 Firefly 驱动的生成式填充和 Premiere 中的生成式扩展,是数百个加速工具中的一部分,提供了创作力量、精确性和控制力。RTX Spark 进一步提升了这些能力,在创意工作流程中实现最高 2 倍的 AI、编辑、调色和特效性能。
Adobe Premiere 将采用全新的视频管线,利用 RTX Spark 的统一内存、Blackwell GPU 和 TensorRT 软件,为编辑和色彩校正提供实时性能、GPU 加速的 AI 性能以及更高效地渲染复杂时间线。此外,Adobe 的 Substance 3D Painter 和 Stager 将在 RTX Spark 上原生运行,实现更流畅、响应更快的 3D 纹理和场景创建工作流程。
Adobe 的下一代 Photoshop 引擎将针对 GPU 加速合成进行优化,支持实时滤镜、高动态范围和现代自然笔刷。基于 AI 原生的管线旨在充分利用 RTX Spark 的全部力量,包括 TensorRT。
Adobe 将进一步扩展 Premiere 和 Photoshop,允许用户通过 Windows 代理进行创建、编辑和设计,为创作者提供一个协作伙伴,加速其工作流程。
Adobe 创意应用(如 Premiere、Photoshop 和 Substance)的更新预计将与 RTX Spark 的上市同步推出。
## **面向创作者的新工具和应用更新**
新的 NVIDIA 平台更新和合作伙伴应用优化正在整个 RTX 生态系统中推出——部分今天即上线,其余将于今年秋季随 RTX Spark 一同到来。
NVIDIA Broadcast 2.2 将 Studio Voice(一项让任何麦克风都能发出录音室级音质的 AI 功能)从测试版毕业。Studio Voice 即日起可在 GeForce RTX 3060 及以上 GPU 上运行,性能更佳。该应用还获得了 Elgato Stream Deck 集成和可配置键盘快捷键。
通过 Elgato MCP 服务器,Project G-Assist 也增加了 Stream Deck 支持,让用户能够为其流媒体设置启用 AI 助手功能。
此外,Blender Cycles 正在集成 DLSS 4.5 Ray Reconstruction 作为新的降噪器,将路径追踪视口转变为交互式实时查看器。这使 3D 艺术家可以在场景中导航,同时看到接近最终渲染的质量,彻底改变照明和外观开发工作流程。该更新将于今年秋季随 RTX Spark 一同在 Blender 5.3 中发布。
同样随 RTX Spark 推出的还有 RTX Video Frame Generation,这是一种新的 AI 效果,可实时将视频帧率提高一倍或四倍——非常适合增强 AI 模型通常生成的 15-20 帧/秒(fps)输出。它以 Python wheel 和 ComfyUI 节点形式提供,让 AI 艺术家可以在低帧率下更快生成视频,然后插值到流畅的播放速率。
## **#ICYMI: RTX AI Garage 最新动态**
🪐 **阅读完整的 NVIDIA RTX Spark 公告**,了解超级芯片、NVIDIA 与 Windows 在代理方面的合作,以及合作伙伴笔记本电脑和小型台式机的详细信息。
💻 **ASUS ProArt 创作者笔记本电脑现已预装 Black Forest Labs 的 FLUX.2 Klein 4B**——一款通过 MuseTree 应用预装的蒸馏图像模型,采用 NVFP4 格式和 NVIDIA TensorRT for RTX 软件开发套件优化。创作者可获得高达 2.5 倍的加速和 560% 的内存减少,首次开箱即可直接在本地生成图像——无需下载模型或设置 ComfyUI。
🎬 **NVIDIA AI for Media 软件开发套件引入了多项更新**,包括针对法语、德语和西班牙语优化的新 LipSync NVIDIA NIM 微服务。Active Speaker Detection NIM 微服务还增加了多摄像头支持,具备跨视频发言人关联功能。
🤖 **查看关于 Hermes Agent 的最新 RTX AI Garage 博客文章**,了解 RTX PC 和 DGX Spark 上的自我改进 AI。
*在 Facebook、Instagram、TikTok 和 X 上关注 RTX Spark——并通过订阅 RTX Spark 新闻简报保持信息更新。*
*请参阅关于软件产品信息的通知。*
相似文章
从 RTX 到 Spark:NVIDIA 加速 Gemma 4 赋能本地智能体 AI
NVIDIA 与谷歌合作优化 Gemma 4 模型,以实现在 RTX GPU、DGX Spark 和 Jetson 设备上的本地部署,从而支持高效的端侧智能体 AI,具备推理、编程、多模态能力以及 35 多种语言的支持。
NVIDIA与微软合作推出智能体AI部署统一技术栈,覆盖Windows设备、云及本地环境
NVIDIA与微软深化合作,推出面向智能体AI部署的统一技术栈,涵盖Windows PC(RTX Spark、DGX Station)、Azure云及本地环境,并带来全新开放模型与安全运行时。
Nvidia瞄准2000亿美元CPU市场,与微软、戴尔、惠普合作推出AI代理PC
Nvidia宣布推出用于AI代理PC的RTX Spark CPU,并与微软、戴尔、惠普等主要PC制造商合作,目标占领2000亿美元市场。
@Saboo_Shubham_: 到2026年底,每个人都能在自己的电脑上运行一支AI代理团队。配备128GB统一内存的NVIDIA RTX Spark就是为此而生。
这条推文预测到2026年底每个人都能在PC上运行AI代理,重点介绍了配备128GB统一内存的NVIDIA RTX Spark,专为始终在线的本地代理设计,并提供了运行本地编码代理的指南。
首个完全自主的LLM代理网络攻击被记录……NVIDIA与微软发布“RTX Spark”超级芯片
NVIDIA在GTC台北大会上推出了RTX Spark超级芯片,专为本地AI代理设计,拥有1 petaflop性能和128GB统一内存,并得到微软和Adobe的支持。此外,Sysdig记录了首个完全自主、无需任何人工干预的LLM代理网络攻击。