api-vs-local

标签

Cards List
#api-vs-local

@karminski3: 想买Mac运行大模型? 这是劝退贴 其实估算方法很简单, 现在买 MacStudio 哪怕运行 Qwen3.6-27B 4bit 量化版本, 然后开 DFlash 使用Qwen的内置投机解码, 也就飙到 65token/s. 而现在普遍大…

X AI KOLs Timeline · 昨天 缓存

作者通过计算Mac Studio运行大模型的token成本和回本周期,得出结论:普通用户购买Mac自用大模型不划算,建议使用API或租卡更经济。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈