api-vs-local

标签

#api-vs-local

@karminski3: 想买Mac运行大模型? 这是劝退贴其实估算方法很简单, 现在买 MacStudio 哪怕运行 Qwen3.6-27B 4bit 量化版本, 然后开 DFlash 使用Qwen的内置投机解码, 也就飙到 65token/s. 而现在普遍大…

X AI KOLs Timeline ↗ · 昨天缓存

作者通过计算Mac Studio运行大模型的token成本和回本周期，得出结论：普通用户购买Mac自用大模型不划算，建议使用API或租卡更经济。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈