关于 DS4 的几句话

Hacker News Top 2026/05/14 22:29 工具

local-ai deepseek quantization mac open-weights inference dwarfstar

摘要

Antirez 宣布了 DwarfStar 4 (DS4)，这是一个本地AI工具，它采用非对称 2/8 位量化，在高端消费级硬件上运行 DeepSeek v4 Flash，实现接近前沿的性能。他谈到了该项目的迅速流行、未来的模型更新和分布式推理计划，以及本地AI对严肃任务的重要性。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/05/15 00:27

# 关于 DS4 的几句话来源：https://antirez.com/news/165 antirez (https://antirez.com/user/antirez)2 小时前 · 24715 次浏览我没想到 DwarfStar 4 (https://github.com/antirez/ds4) 会这么快变得如此受欢迎。很明显，大家对基于单一模型整合的本地 AI 体验存在需求，而几件事恰好同时发生：一个准前沿模型发布，它既足够大也足够快，足以改变本地推理的游戏规则；而且该模型与 2/8 位这样极不对称的量化方案配合得非常好，使得 96 或 128GB 内存就足够运行。当然，还有：过去几年本地 AI 运动积累的所有经验，这些经验借助 GPT 5.5 得以更快地利用（否则你不可能在一周内构建出 DS4——即便有这么多帮助，你也需要懂得如何温和地与 LLM 对话）。上周既有趣又累人，我平均每天工作 14 小时。自从 Redis 早期以来，我的正常平均工作时长是 4/6 小时，但 Redis 最初几个月也是这样的。那么，接下来呢？这是一个始于 DeepSeek v4 Flash 也终于它的项目吗？不，模型是可以随时间变化的。在我看来，这个空间将由当前最好的开源权重模型占据，该模型在高端 Mac 或“GPU 一体机”设备（如 DGX Spark 和其他类似设置）上 *实用快速*。我打赌下一个竞争者就是 DeepSeek v4 Flash 本身——在即将发布的新检查点中，或许还有一个专门针对代码调优的版本，谁知道呢，可能还有其他专家变体（不是 MoE 专家的意思）。毕竟，对本地推理而言，拥有 ds4-coding、ds4-legal、ds4-medical 这些模型是很有意义的。你只需根据问题加载需要的模型。自从我开始玩本地推理（我一开始就在玩）以来，这是我第一次发现自己会使用本地模型完成原本会找 Claude/GPT 处理的严肃任务。我认为这确实是一件大事。这也是我首次通过使用向量引导，享受到可以更自由地使用 LLM 的体验。DeepSeek v4 Flash 无疑是一款令人印象深刻的模型。如果你能在脑海中将较好的小型本地模型体验视为 A，将你在网上使用的前沿模型体验视为 B，那么 DS4 更像 B 而非 A。说实话，我迫不及待想看到新的发布了（顺便说一句，感谢 DeepSeek）。因此，在经历了最初几天的混乱之后，我希望项目能聚焦于：质量基准测试、可能增加一个作为项目一部分的编码代理、在我家布置一套硬件运行 CI 测试以确保长期质量、更多的端口，最后但非常重要的一点是：分布式推理（包括串行和并行）。现在，感谢所有的支持：真的很感激 :) AI 太重要了，不能仅仅作为一种服务提供。博客评论由 Disqus (https://disqus.com/) 提供支持

关于 DS4 的几句话

相似文章

@antirez：DS4 现已更名为 DwarfStar4，因为你可以将大量质量压缩进极小的空间……几分钟后它将……

@ttasanen: 刚刚在我的 Mac Studio M3 Ultra 256GB 上运行了 @antirez 开发的 DS4，天哪，真的令人印象深刻。一个简洁、专为……

DS4

@antirez: DS4 正在 DGX Spark (GB10 / CUDA) 上运行，目前为私有分支。12 tokens/sec，此系统的内存带宽受限……

antirez/deepseek-v4-gguf

提交意见反馈