2台配备 512GB 内存的 M3 Ultra Mac Studio

Reddit r/LocalLLaMA 2026/04/21 01:58 新闻

local-inference apple-silicon llm-inference open-source hardware distributed-inference

摘要

硬件投入约 2.5 万美元。告诉我你们希望我在这两台设备上部署什么模型，我会协助测试。目前我已通过 Exo 后端跑通了 DeepSeek v3.2 Q8 版本；当前每台设备均在运行 GLM 5.1 Q4（正在排查为何 Exo 无法加载 Q8 版本）。静候社区完成 Kimi 2.6 针对 MLX/mmap 的优化适配。

查看原文

相似文章

@Prince_Canuma：我的 MLX 与研究家用计算平台：• M3 Ultra — 512GB（由社区与 @wai_protocol 赞助）• RTX PRO 6000 — 96GB…

X AI KOLs Timeline

一位研究人员分享了用于 MLX 和 AI 研究的家用计算配置，包含配备 512GB 的 M3 Ultra、配备 96GB 的 RTX PRO 6000，以及用于模型移植与压力测试的配备 96GB 的 M3 Max。

@tom_doerr: 在 16GB 内存 Mac 上运行 35B 模型 https://github.com/walter-grace/mac-code…

X AI KOLs Timeline

该工具支持通过从 SSD 流式加载模型权重，在 16GB Mac 上运行 Qwen3.5-35B 等大型语言模型，经优化配置后最高可达 30 tok/s。

@antirez: DeepSeek v4 PRO 通过SSD流式传输在我的128GB MacBook m5 max上运行。1.6万亿参数。

X AI KOLs Timeline

DeepSeek v4 PRO，一个拥有1.6万亿参数的模型，通过SSD流式传输在128GB MacBook m5 max上运行，展示了本地运行大规模模型的能力。

在配备 24GB 内存的 M4 芯片上运行本地模型

Hacker News Top

指南介绍了如何使用 LM Studio、Ollama 等工具，在拥有 24GB 内存的 M4 MacBook 上运行 Qwen 3.5-9B 等本地 AI 模型，并提供了优化性能的具体配置建议。

@remilouf: 在 @julien_c 的推文之后，我买了一台配备 128B 统一内存的 MacBook Pro，并开始将 Qwen3.6 作为我的日常驱…

X AI KOLs Following

作者分享了在配备 128GB 统一内存的 MacBook Pro 上运行 Qwen3.6 模型的经验，称赞了苹果硬件在本地 AI 推理方面的效率。

相似文章

@Prince_Canuma：我的 MLX 与研究家用计算平台：• M3 Ultra — 512GB（由社区与 @wai_protocol 赞助）• RTX PRO 6000 — 96GB…

@tom_doerr: 在 16GB 内存 Mac 上运行 35B 模型 https://github.com/walter-grace/mac-code…

@antirez: DeepSeek v4 PRO 通过SSD流式传输在我的128GB MacBook m5 max上运行。1.6万亿参数。

在配备 24GB 内存的 M4 芯片上运行本地模型

@remilouf: 在 @julien_c 的推文之后，我买了一台配备 128B 统一内存的 MacBook Pro，并开始将 Qwen3.6 作为我的日常驱…

提交意见反馈