关于 DS4 的几句话

Hacker News Top 工具

摘要

Antirez 宣布了 DwarfStar 4 (DS4),这是一个本地AI工具,它采用非对称 2/8 位量化,在高端消费级硬件上运行 DeepSeek v4 Flash,实现接近前沿的性能。他谈到了该项目的迅速流行、未来的模型更新和分布式推理计划,以及本地AI对严肃任务的重要性。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/15 00:27

# 关于 DS4 的几句话 来源:https://antirez.com/news/165 antirez (https://antirez.com/user/antirez)2 小时前 · 24715 次浏览 我没想到 DwarfStar 4 (https://github.com/antirez/ds4) 会这么快变得如此受欢迎。很明显,大家对基于单一模型整合的本地 AI 体验存在需求,而几件事恰好同时发生:一个准前沿模型发布,它既足够大也足够快,足以改变本地推理的游戏规则;而且该模型与 2/8 位这样极不对称的量化方案配合得非常好,使得 96 或 128GB 内存就足够运行。当然,还有:过去几年本地 AI 运动积累的所有经验,这些经验借助 GPT 5.5 得以更快地利用(否则你不可能在一周内构建出 DS4——即便有这么多帮助,你也需要懂得如何温和地与 LLM 对话)。 上周既有趣又累人,我平均每天工作 14 小时。自从 Redis 早期以来,我的正常平均工作时长是 4/6 小时,但 Redis 最初几个月也是这样的。 那么,接下来呢?这是一个始于 DeepSeek v4 Flash 也终于它的项目吗?不,模型是可以随时间变化的。在我看来,这个空间将由当前最好的开源权重模型占据,该模型在高端 Mac 或“GPU 一体机”设备(如 DGX Spark 和其他类似设置)上 *实用快速*。我打赌下一个竞争者就是 DeepSeek v4 Flash 本身——在即将发布的新检查点中,或许还有一个专门针对代码调优的版本,谁知道呢,可能还有其他专家变体(不是 MoE 专家的意思)。毕竟,对本地推理而言,拥有 ds4-coding、ds4-legal、ds4-medical 这些模型是很有意义的。你只需根据问题加载需要的模型。 自从我开始玩本地推理(我一开始就在玩)以来,这是我第一次发现自己会使用本地模型完成原本会找 Claude/GPT 处理的严肃任务。我认为这确实是一件大事。这也是我首次通过使用向量引导,享受到可以更自由地使用 LLM 的体验。DeepSeek v4 Flash 无疑是一款令人印象深刻的模型。如果你能在脑海中将较好的小型本地模型体验视为 A,将你在网上使用的前沿模型体验视为 B,那么 DS4 更像 B 而非 A。说实话,我迫不及待想看到新的发布了(顺便说一句,感谢 DeepSeek)。 因此,在经历了最初几天的混乱之后,我希望项目能聚焦于:质量基准测试、可能增加一个作为项目一部分的编码代理、在我家布置一套硬件运行 CI 测试以确保长期质量、更多的端口,最后但非常重要的一点是:分布式推理(包括串行和并行)。 现在,感谢所有的支持:真的很感激 :) AI 太重要了,不能仅仅作为一种服务提供。 博客评论由 Disqus (https://disqus.com/) 提供支持

相似文章

DS4

Reddit r/LocalLLaMA

Salvatore Sanfilippo 发布了 DS4 项目,使 DeepSeek V3(文中称为 V4)Flash 能够在 Mac Metal 硬件上运行 100 万(1M)上下文窗口,并有望支持 DGX 和 AMD 芯片。

antirez/deepseek-v4-gguf

Hugging Face Models Trending

Antirez发布了专门为DS4推理引擎优化的DeepSeek V4 Flash GGUF量化版本,针对不同内存大小提供了优化配置,使得这个大型MoE模型可以在本地运行。