关于 DS4 的几句话
摘要
Antirez 宣布了 DwarfStar 4 (DS4),这是一个本地AI工具,它采用非对称 2/8 位量化,在高端消费级硬件上运行 DeepSeek v4 Flash,实现接近前沿的性能。他谈到了该项目的迅速流行、未来的模型更新和分布式推理计划,以及本地AI对严肃任务的重要性。
暂无内容
查看缓存全文
缓存时间: 2026/05/15 00:27
# 关于 DS4 的几句话
来源:https://antirez.com/news/165
antirez (https://antirez.com/user/antirez)2 小时前 · 24715 次浏览
我没想到 DwarfStar 4 (https://github.com/antirez/ds4) 会这么快变得如此受欢迎。很明显,大家对基于单一模型整合的本地 AI 体验存在需求,而几件事恰好同时发生:一个准前沿模型发布,它既足够大也足够快,足以改变本地推理的游戏规则;而且该模型与 2/8 位这样极不对称的量化方案配合得非常好,使得 96 或 128GB 内存就足够运行。当然,还有:过去几年本地 AI 运动积累的所有经验,这些经验借助 GPT 5.5 得以更快地利用(否则你不可能在一周内构建出 DS4——即便有这么多帮助,你也需要懂得如何温和地与 LLM 对话)。
上周既有趣又累人,我平均每天工作 14 小时。自从 Redis 早期以来,我的正常平均工作时长是 4/6 小时,但 Redis 最初几个月也是这样的。
那么,接下来呢?这是一个始于 DeepSeek v4 Flash 也终于它的项目吗?不,模型是可以随时间变化的。在我看来,这个空间将由当前最好的开源权重模型占据,该模型在高端 Mac 或“GPU 一体机”设备(如 DGX Spark 和其他类似设置)上 *实用快速*。我打赌下一个竞争者就是 DeepSeek v4 Flash 本身——在即将发布的新检查点中,或许还有一个专门针对代码调优的版本,谁知道呢,可能还有其他专家变体(不是 MoE 专家的意思)。毕竟,对本地推理而言,拥有 ds4-coding、ds4-legal、ds4-medical 这些模型是很有意义的。你只需根据问题加载需要的模型。
自从我开始玩本地推理(我一开始就在玩)以来,这是我第一次发现自己会使用本地模型完成原本会找 Claude/GPT 处理的严肃任务。我认为这确实是一件大事。这也是我首次通过使用向量引导,享受到可以更自由地使用 LLM 的体验。DeepSeek v4 Flash 无疑是一款令人印象深刻的模型。如果你能在脑海中将较好的小型本地模型体验视为 A,将你在网上使用的前沿模型体验视为 B,那么 DS4 更像 B 而非 A。说实话,我迫不及待想看到新的发布了(顺便说一句,感谢 DeepSeek)。
因此,在经历了最初几天的混乱之后,我希望项目能聚焦于:质量基准测试、可能增加一个作为项目一部分的编码代理、在我家布置一套硬件运行 CI 测试以确保长期质量、更多的端口,最后但非常重要的一点是:分布式推理(包括串行和并行)。
现在,感谢所有的支持:真的很感激 :) AI 太重要了,不能仅仅作为一种服务提供。
博客评论由 Disqus (https://disqus.com/) 提供支持
相似文章
@antirez:DS4 现已更名为 DwarfStar4,因为你可以将大量质量压缩进极小的空间……几分钟后它将……
Antirez 宣布将 DS4 更名为 DwarfStar4,并预告将采用自研 iMatrix 方案,为 128GB Mac 带来优化后的 2-bit 量化模型。
@ttasanen: 刚刚在我的 Mac Studio M3 Ultra 256GB 上运行了 @antirez 开发的 DS4,天哪,真的令人印象深刻。一个简洁、专为……
DS4 是由 antirez 开发的专业推理引擎,专为在高端 Mac 硬件上本地运行 DeepSeek V4 Flash 而设计,具有优化的 KV 缓存处理和 100 万上下文支持。
DS4
Salvatore Sanfilippo 发布了 DS4 项目,使 DeepSeek V3(文中称为 V4)Flash 能够在 Mac Metal 硬件上运行 100 万(1M)上下文窗口,并有望支持 DGX 和 AMD 芯片。
@antirez: DS4 正在 DGX Spark (GB10 / CUDA) 上运行,目前为私有分支。12 tokens/sec,此系统的内存带宽受限……
Antirez 报告了在 DGX Spark (GB10) 上对 DS4 推理进行的基准测试,指出生成速度为 12 tokens/sec,预填充性能较高,并计划在该代码库成熟后将其合并。
antirez/deepseek-v4-gguf
Antirez发布了专门为DS4推理引擎优化的DeepSeek V4 Flash GGUF量化版本,针对不同内存大小提供了优化配置,使得这个大型MoE模型可以在本地运行。