@LyalinDotCom: https://x.com/LyalinDotCom/status/2059023609536839684
摘要
比较在DGX Spark和MacBook Pro M5上运行Gemma 4的情况,作者对收到DGX Spark表示感谢。
https://t.co/WgSUvDWupq
查看缓存全文
缓存时间: 2026/05/26 13:11
Gemma 4 对决:DGX Spark 与 MacBook Pro M5
最近几周我深感幸运,其中一个例子就是通过一位新朋友,一台全新的 DGX Spark 来到了我的生活中(谢谢 @gabegreenberg!)。我手头也已经有 MacBook Pro M5 128 了。
相似文章
@jun_song: 最佳中端本地LLM硬件:DGX Spark 对比 Mac Studio M5 Max 128GB(即将推出)价格:4700美元(二手或OEM更便宜)…
DGX Spark与Mac Studio M5 Max在本地运行LLM的对比,重点比较了解码速度、预填充性能、内存、功耗和成本。Mac在解码带宽上胜出,但DGX在预填充方面更快并支持批处理。
@antirez: 致DGX Spark用户。这就是你在硬件上使用DS4得到的效果。我想发布这个以展示,尽管生成速度不快,但快速的预填充使得系统仍然非常好用。
antirez分享了一个在DGX Spark上使用DS4的演示,展示了尽管生成速度慢,但快速的预填充保持了系统的可用性。
M5 vs DGX Spark vs Strix Halo vs RTX 6000
一位用户在过去3天内对M5 Mac、DGX Spark、Strix Halo和RTX 6000进行了AI工作负载的基准测试,并将结果发布到GitHub。M5在内存带宽和令牌生成方面优于DGX Spark,而MacBook的散热表现出奇地好,但噪音较大。
在MLX中使用turboquant(及自定义内核)运行Gemma4 26b MoE
一位开发者成功在Apple MacBook Air M5上使用MLX、turboquant和自定义内核运行了Gemma4 26b MoE,实现了比llama.cpp更快的提示处理和生成速度,且内存占用更低。实现方式包括本地部署说明。
@HuggingModels:Gemma 4 来了,它针对 Apple Silicon 进行了优化。这款 4 位量化模型在您的 Mac 上运行快速,而不仅仅是在…
Gemma 4 是一款针对 Apple Silicon 优化的 4 位量化模型,能够在 Mac 设备上实现快速本地推理,减少对云计算的依赖。