@axiaisacat: Redis 作者 antirez 又扔了个硬核项目:ds4。 不是又一个 GGUF runner,而是专门为 DeepSeek V4 Flash 写的本地推理引擎: Metal / CUDA 2-bit 量化 1M context KV …

X AI KOLs Timeline 工具

摘要

Redis creator antirez released ds4, a local inference engine optimized for DeepSeek V4 Flash with 2-bit quantization and support for 1M context KV cache on Metal and CUDA.

Redis 作者 antirez 又扔了个硬核项目:ds4。 不是又一个 GGUF runner,而是专门为 DeepSeek V4 Flash 写的本地推理引擎: Metal / CUDA 2-bit 量化 1M context KV cache 可落盘 面向高配 Mac 和 DGX Spark 重点不是“能跑”,而是想把一个本地大模型做成完整可用的工程闭环。 本地 AI https://t.co/c2TFtHfQwX
查看原文
查看缓存全文

缓存时间: 2026/05/14 16:40

Redis 作者 antirez 又扔了个硬核项目:ds4。

不是又一个 GGUF runner,而是专门为 DeepSeek V4 Flash 写的本地推理引擎:

Metal / CUDA 2-bit 量化 1M context KV cache 可落盘 面向高配 Mac 和 DGX Spark 重点不是“能跑”,而是想把一个本地大模型做成完整可用的工程闭环。 本地 AI https://t.co/c2TFtHfQwX

相似文章

antirez/deepseek-v4-gguf

Hugging Face Models Trending

Antirez发布了专门为DS4推理引擎优化的DeepSeek V4 Flash GGUF量化版本,针对不同内存大小提供了优化配置,使得这个大型MoE模型可以在本地运行。

关于 DS4 的几句话

Hacker News Top

Antirez 宣布了 DwarfStar 4 (DS4),这是一个本地AI工具,它采用非对称 2/8 位量化,在高端消费级硬件上运行 DeepSeek v4 Flash,实现接近前沿的性能。他谈到了该项目的迅速流行、未来的模型更新和分布式推理计划,以及本地AI对严肃任务的重要性。