标签
宣布 Orinth 1.0 AEON ULTIMATE UNCENSORED,这是一个采用 BF16 和 NVFP4 量化的模型,适用于 DGX Spark/Blackwell 架构,声称在启用 DFlash 的情况下性能提升 200-300%。
一条推文详细介绍了在Nvidia DGX Spark上可以运行的最佳AI模型,包括Qwen 3.6和DeepSeek v4 Flash变体,以及单机和多机设置下的token速度和上下文长度。
关于是在本地运行AI模型还是通过API运行的详细分析,涵盖了RTX 5090、RTX PRO 6000和DGX Spark等硬件选项,重点讨论了内存与带宽的权衡、成本考虑以及隐私需求。
作者在4× DGX Spark (GB10)设备上成功运行了配备MTP投机解码的GLM-5.2,并揭示了公开构建配方中缺失的一个组件。
关于在单台DGX Spark上使用sglang推理和自定义mega-kernel以11 tok/s运行未量化的DeepSeek-v4-Flash模型的更新,正在向GLM-5.2迈进。
Spark Doctor 是一个开源的诊断命令行工具,专为NVIDIA DGX Spark设计,可收集系统、GPU、内存、Docker和配方数据,应用特定规则,并输出常见问题的可能原因及后续步骤。
用户询问在四个 Ascend GX10 或 DGX Sparks 上以 4 位量化运行 GLM-5.2 的可行性,想知道在 100k 上下文下的速度和内存情况。
AMD推出Ryzen AI Halo开发者平台,这是一款售价3999美元的迷你PC,配备128GB统一内存并支持Windows 11,与Nvidia的DGX Spark在本地AI工作负载领域竞争。
一位 Reddit 用户分享了在双华硕 GX10 DGX Spark 配置上运行 DeepSeek V4 Flash 的经验,详细介绍了性能指标、配置和功耗,并提供了不同上下文长度下的吞吐量基准测试结果。
戴尔确认了一款搭载NVIDIA N1X芯片的新XPS笔记本,本质上就是DGX Spark GB10的消费者版本,将在Computex上发布。
一条推文猜测,售价低于1000美元的NVIDIA DGX Spark迷你版可能带来巨额利润;同时,另一条引用推文讨论了即将推出的NVIDIA N1和N1X ARM架构笔记本电脑芯片,目标直指苹果的轻薄笔记本电脑市场。
比较在DGX Spark和MacBook Pro M5上运行Gemma 4的情况,作者对收到DGX Spark表示感谢。
antirez分享了一个在DGX Spark上使用DS4的演示,展示了尽管生成速度慢,但快速的预填充保持了系统的可用性。
一位用户分享了在 NVIDIA DGX Spark 上使用 vLLM 运行 Qwen3.6 模型的基准测试结果和配置,重点关注包含并发请求和工具调用的智能体工作负载。
用户分享了一种在单台 DGX Spark 上使用 vLLM 运行 Qwen 3.5 122B Int4 的优化方案,实现了每秒超过 40 个 token 的速度。他们邀请其他人尝试并进一步优化。
一位用户在过去3天内对M5 Mac、DGX Spark、Strix Halo和RTX 6000进行了AI工作负载的基准测试,并将结果发布到GitHub。M5在内存带宽和令牌生成方面优于DGX Spark,而MacBook的散热表现出奇地好,但噪音较大。
DGX Spark与Mac Studio M5 Max在本地运行LLM的对比,重点比较了解码速度、预填充性能、内存、功耗和成本。Mac在解码带宽上胜出,但DGX在预填充方面更快并支持批处理。
Nous Research与NVIDIA AI合作,确保Hermes Agent在DGX Spark上顺畅运行。