DS4
摘要
Salvatore Sanfilippo 发布了 DS4 项目,使 DeepSeek V3(文中称为 V4)Flash 能够在 Mac Metal 硬件上运行 100 万(1M)上下文窗口,并有望支持 DGX 和 AMD 芯片。
Redis 的创造者 Salvatore Sanfilippo 在 GitHub 上发布了一个名为 DS4 的新项目。[https://github.com/antirez/ds4/](https://github.com/antirez/ds4/) 简而言之,该项目旨在让 DeepSeek V4 Flash 在 Mac Metal 硬件上以 100 万(1M)上下文窗口运行。其中包含一些新颖的技术手段。几个小时前,他发布了一段在 DGX 上运行的视频:[https://x.com/antirez/status/2053381973226184749](https://x.com/antirez/status/2053381973226184749) 如果他们能在 DGX 上运行,那么也许也能在 A6000(Pro 6000 的笔误,应为 A100/A100 系列或指代高端显卡,此处保留原意直译为 Pro 6000 可能指代某种高端型号,但通常语境下 DGX 为服务器,Mac 为客户端,中间可能指代其他 GPU 型号,这里按原文直译)上以稍小的上下文窗口高速运行。此外,我认为未来他们也可能适配 AMD 芯片。该服务器已经提供了 OpenAI 和 Anthropic 的接口,可用于 Agentic 代码工具。我知道这个子版块的用户拥有顶级的硬件设备。我鼓励大家去查看这个项目,看看是否能为其做出贡献。
相似文章
@ttasanen: 刚刚在我的 Mac Studio M3 Ultra 256GB 上运行了 @antirez 开发的 DS4,天哪,真的令人印象深刻。一个简洁、专为……
DS4 是由 antirez 开发的专业推理引擎,专为在高端 Mac 硬件上本地运行 DeepSeek V4 Flash 而设计,具有优化的 KV 缓存处理和 100 万上下文支持。
关于 DS4 的几句话
Antirez 宣布了 DwarfStar 4 (DS4),这是一个本地AI工具,它采用非对称 2/8 位量化,在高端消费级硬件上运行 DeepSeek v4 Flash,实现接近前沿的性能。他谈到了该项目的迅速流行、未来的模型更新和分布式推理计划,以及本地AI对严肃任务的重要性。
Metal 上的 DeepSeek V4 Flash 本地推理引擎
ds4 是一款专为 Apple Silicon 优化的 DeepSeek V4 Flash 本地原生推理引擎,支持基于磁盘的 KV 缓存持久化和 Metal 加速。
@Snixtp: DeepSeek V4 Flash 能否在单张 RTX Pro 6000 上运行?
antirez 已发布 DeepSeek V4 Flash 的 GGUF 量化版本,使该模型能够在单张 GPU(如 RTX Pro 6000)以及 128GB 以上内存的 Mac 上运行。量化文件已上传至 Hugging Face,并附有 DS4 推理引擎的使用说明。
你可以在 Mac (M3 Max, 96GB) 上运行 Deepseek 4 flash
介绍如何在配备 96GB 内存的 Mac M3 Max 上,使用 Antirez 的 ds4 引擎和 SSD 流式传输运行 DeepSeek 4 flash,实现约每秒 12 token 的推理速度。