@ivanfioravanti: 给那些想知道在 M5 Max 上本地运行 ds4-agent 并使用 DeepSeek V4 Flash q2-imatrix gguf 模型意味着什么的人…
摘要
演示在 M5 Max 上本地运行 ds4-agent 并使用 DeepSeek V4 Flash q2-imatrix gguf 模型,展示了自我更新能力以及与 HF_HOME 的集成以用于 gguf 模型。
查看缓存全文
缓存时间: 2026/05/24 00:17
如有好奇者想知道,在M5 Max上使用DeepSeek V4 Flash q2-imatrix gguf模型本地运行ds4-agent是什么体验——这段视频展示了ds4自我更新,并新增了利用HF_HOME配置gguf模型的功能。本地AI的未来一片光明!https://t.co/CIceef3LWq
相似文章
@mishig25: M3 Max users really got local AGI before GTA VI
M3 Max users really got local AGI before GTA VI https://t.co/AfaFukk6jR --- # antirez/deepseek-v4-gguf · Hugging Face Source: [https://huggingface.co/antirez/deepseek-v4-gguf](https://huggingface.co/antirez/deepseek-v4-gguf) ## [https://huggingface.co/antirez/deepseek-v4-gguf#deepseek-v4-flash--gguf-for-ds4](https://huggingface.co/antirez/deepseek-v4-gguf#deepseek-v4-flash--gguf-for-ds4)DeepSeek V4 Flash — GGUF for ds4 This quants are specific for the DS4 inference engine\. They may work with ot
antirez/deepseek-v4-gguf
Antirez发布了专门为DS4推理引擎优化的DeepSeek V4 Flash GGUF量化版本,针对不同内存大小提供了优化配置,使得这个大型MoE模型可以在本地运行。
我在家运行了(更快的)DeepSeek V4 Pro
用户报告成功使用 ktransformers 在本地运行 DeepSeek V4 Pro 模型,并分享了在不同上下文深度下的详细基准测试结果,展示了改进的推理速度。
@ttasanen: 刚刚在我的 Mac Studio M3 Ultra 256GB 上运行了 @antirez 开发的 DS4,天哪,真的令人印象深刻。一个简洁、专为……
DS4 是由 antirez 开发的专业推理引擎,专为在高端 Mac 硬件上本地运行 DeepSeek V4 Flash 而设计,具有优化的 KV 缓存处理和 100 万上下文支持。
@mitsuhiko:太棒了!@antirez 已将我的工具参数流式传输修改合并至 ds4。这意味着你现在只需安装 pi 扩展就能……
开发者 mitsuhiko 发布了一款开源 Pi 扩展,可与 ds4 深度集成,大幅简化在 macOS 本地运行 DeepSeek V4 Flash 的流程。该工具实现了模型自动下载、依据内存容量智能选择量化版本以及服务器全生命周期管理,为本地 LLM 提供开箱即用的流畅体验。