@antirez: DeepSeek v4 PRO 通过SSD流式传输在我的128GB MacBook m5 max上运行。1.6万亿参数。

X AI KOLs Timeline 2026/06/04 14:05 模型

deepseek v4-pro ssd-streaming large-language-model local-inference macbook 1-6-trillion-parameters

摘要

DeepSeek v4 PRO，一个拥有1.6万亿参数的模型，通过SSD流式传输在128GB MacBook m5 max上运行，展示了本地运行大规模模型的能力。

DeepSeek v4 PRO 通过SSD流式传输在我的128GB MacBook m5 max上运行。1.6万亿参数。https://t.co/rokyvu16Ut

查看原文

查看缓存全文

缓存时间: 2026/06/05 09:10

DeepSeek v4 PRO 通过 SSD 流式运行在我的 128GB MacBook m5 max 上。1.6 万亿参数。https://t.co/rokyvu16Ut

相似文章

你可以在 Mac (M3 Max, 96GB) 上运行 Deepseek 4 flash

Reddit r/LocalLLaMA

介绍如何在配备 96GB 内存的 Mac M3 Max 上，使用 Antirez 的 ds4 引擎和 SSD 流式传输运行 DeepSeek 4 flash，实现约每秒 12 token 的推理速度。

@antirez: 我没想到 DeepSeek v4 PRO（非 Flash 版本）能在配备 512GB 内存的 Mac Studio M3 Ultra 上流畅运行。这是 2 位量化的……

X AI KOLs Timeline

Antirez 报告称，DeepSeek v4 PRO 在配备 512GB 内存的 Mac Studio M3 Ultra 上使用 2 位量化运行良好，预填充速度达到 130 t/s，生成速度达到 13 t/s。

我在家运行了（更快的）DeepSeek V4 Pro

Reddit r/LocalLLaMA

用户报告成功使用 ktransformers 在本地运行 DeepSeek V4 Pro 模型，并分享了在不同上下文深度下的详细基准测试结果，展示了改进的推理速度。

2台配备 512GB 内存的 M3 Ultra Mac Studio

Reddit r/LocalLLaMA

硬件投入约 2.5 万美元。告诉我你们希望我在这两台设备上部署什么模型，我会协助测试。目前我已通过 Exo 后端跑通了 DeepSeek v3.2 Q8 版本；当前每台设备均在运行 GLM 5.1 Q4（正在排查为何 Exo 无法加载 Q8 版本）。静候社区完成 Kimi 2.6 针对 MLX/mmap 的优化适配。

@ciruai：在配备128GB内存的AMD Ryzen AI Max+ 395 Strix Halo上测试DeepSeek v4 Flash。在中等长度上下文中获得约15 TPS……

X AI KOLs Timeline

在配备128GB内存的AMD Ryzen AI Max+ 395上测试DeepSeek v4 Flash，本地运行284B MoE模型（13B活跃参数）可达约15 TPS。成本仅需3000美元，而数据中心配置需25000美元以上，凸显了在消费级硬件上运行大型模型的可行性。

相似文章

你可以在 Mac (M3 Max, 96GB) 上运行 Deepseek 4 flash

@antirez: 我没想到 DeepSeek v4 PRO（非 Flash 版本）能在配备 512GB 内存的 Mac Studio M3 Ultra 上流畅运行。这是 2 位量化的……

我在家运行了（更快的）DeepSeek V4 Pro

2台配备 512GB 内存的 M3 Ultra Mac Studio

@ciruai：在配备128GB内存的AMD Ryzen AI Max+ 395 Strix Halo上测试DeepSeek v4 Flash。在中等长度上下文中获得约15 TPS……

提交意见反馈