@antirez: 我没想到 DeepSeek v4 PRO(非 Flash 版本)能在配备 512GB 内存的 Mac Studio M3 Ultra 上流畅运行。这是 2 位量化的……

X AI KOLs Timeline 新闻

摘要

Antirez 报告称,DeepSeek v4 PRO 在配备 512GB 内存的 Mac Studio M3 Ultra 上使用 2 位量化运行良好,预填充速度达到 130 t/s,生成速度达到 13 t/s。

我没想到 DeepSeek v4 PRO(非 Flash 版本)能在配备 512GB 内存的 Mac Studio M3 Ultra 上流畅运行。这是使用与 Flash 相同的 DwarfStar 配方的 2 位量化。GGUF 文件大小 433GB。预填充 130 t/s,生成 13 t/s。视频中的预填充速度较低是因为提示词较短。https://t.co/ciyx0XCSh7
查看原文
查看缓存全文

缓存时间: 2026/05/17 11:32

没想到DeepSeek v4 PRO(不是Flash版)在512GB内存的Mac Studio M3 Ultra上跑得这么顺畅。这是采用与Flash版相同的DwarfStar方案的2位量化版本,GGUF文件大小433GB。预填充速度130 t/s,生成速度13 t/s。视频里预填充偏低是因为提示词较短。https://t.co/ciyx0XCSh7

相似文章