deepseek

#deepseek

将大型模型卸载到系统内存时的性能表现？

Reddit r/LocalLLaMA ↗ · 2026-05-24

讨论了将大型AI模型权重从GPU显存卸载到系统内存时的性能权衡，比较了不同GPU配置（如RTX 5090与RTX6000）在运行DeepSeek V4 Pro等模型时的表现。

0 人收藏 0 人点赞

#deepseek

@seclink: 中国初创公司DeepSeek周五宣布，其DeepSeek-V4-Pro API的75%折扣优惠将永久生效，价格低至每百万缓存输入令牌0.003625美元，输出0.87美元——比OpenAI的GPT-5.5便宜约34倍。这款拥有1.6万亿…

X AI KOLs Following ↗ · 2026-05-24 缓存

DeepSeek宣布其V4-Pro API永久降价75%，每百万缓存输入令牌仅0.003625美元，输出0.87美元，比OpenAI的GPT-5.5便宜约34倍。该模型拥有1.6万亿参数但仅需490亿活跃参数，支持100万令牌上下文，在编码和推理基准测试中表现领先。

0 人收藏 0 人点赞

#deepseek

@Michaelzsguo: KV缓存是模型在生成期间的工作记忆。随着上下文窗口变长，模型必须保留更多…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

DeepSeek的KV缓存压缩创新，包括MLA和CSA/HCA，将KV缓存大小减少了93%，实现了高效的长上下文推理和基于SSD的缓存，正如antirez的ds4.c项目所展示的那样。

0 人收藏 0 人点赞

#deepseek

@sheriyuo: 其实我从一开始写 paper 就是纯用 AI 写的，之前用 DeepSeek R1，现在用 V4。因为我不具备英语学术能力，但是我能肉眼看出来这句话、这段话是否合适对于中文写作，我还是比较有自信的，所以我的第一篇 paper 内几乎 9…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

用户分享了自己完全使用AI（DeepSeek R1和V4）撰写学术论文的经验，强调中文大纲和精细的Prompt调优是关键，并指出人工修改AI生成的写作比自行写作更累。

0 人收藏 0 人点赞

#deepseek

@mark_k: 关于DeepSeek AI（@deepseek_ai）的一篇引人入胜且非常深刻的分析文章。你绝对猜不到他们的策略是什么……

X AI KOLs Timeline ↗ · 2026-05-23 缓存

对DeepSeek AI非常规策略的分析：优先采用激进架构创新（MoE、MLA、engram、mHC），大幅降低计算和内存需求，从而实现长期布局，构建一个10万亿人民币的中国AI硬件生态系统，并追求1万亿美元估值。

1 人收藏 1 人点赞

#deepseek

@Michaelzsguo: 发现了一个对你的本地LLM推理优化很有用的工具：https://kvcache.ai/tools/kv-cache-ca…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

一条推文分享了来自KVCache.ai的KV缓存大小计算器，这是一个用于估算本地LLM推理中KV缓存内存使用量的工具，并强调DeepSeek V4 Pro的100万token仅使用5GB内存。

0 人收藏 0 人点赞

#deepseek

@ivanfioravanti: 给那些想知道在 M5 Max 上本地运行 ds4-agent 并使用 DeepSeek V4 Flash q2-imatrix gguf 模型意味着什么的人…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

演示在 M5 Max 上本地运行 ds4-agent 并使用 DeepSeek V4 Flash q2-imatrix gguf 模型，展示了自我更新能力以及与 HF_HOME 的集成以用于 gguf 模型。

0 人收藏 0 人点赞

#deepseek

@rasbt: 感谢一位很棒的新读者贡献，我将 DeepSeek Sparse Attention (DSA) 从头实现的代码添加到了我的 LLMs-from-scratch 仓库中。

X AI KOLs Timeline ↗ · 2026-05-23 缓存

Sebastian Raschka 将 DeepSeek Sparse Attention (DSA) 的从头实现添加到了 LLMs-from-scratch 教育仓库中，包括动机、概述以及一个 GPT 风格的参考实现。

0 人收藏 0 人点赞

#deepseek

编码中90%的枯燥任务基本上已被解决

Reddit r/singularity ↗ · 2026-05-23

一位开发者分享使用廉价AI模型（DeepSeek v4、Hunyuan Hy3预览版）自动化90%编码任务的经验，而Opus则用于更难的10%，强调了成本和延迟权衡。

0 人收藏 0 人点赞

#deepseek

@GithubProjects: Reasonix 是一款专为 DeepSeek 设计的终端 AI 编程代理，旨在通过稳定前缀缓存降低 token 成本……

X AI KOLs Timeline ↗ · 2026-05-23 缓存

Reasonix 是一款针对 DeepSeek 模型优化的终端 AI 编程代理，通过稳定前缀缓存实现了 99.82% 的缓存命中率，并将每次工作负载的 token 成本从约 61 美元降至约 12 美元。

0 人收藏 0 人点赞

#deepseek

@wsl8297: 平时拿 DeepSeek 写代码的人，可以看看 DeepSeek-Code-Whale。 GitHub：https://github.com/usewhale/DeepSeek-Code-Whale… 开源终端 AI 编程 Agent，专…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

DeepSeek-Code-Whale 是一个开源的终端 AI 编程代理，专门为 DeepSeek 模型优化，支持 MCP 工具、Skills 扩展、前缀缓存优化（90% 缓存命中率）和 1M 上下文窗口，旨在降低 AI 编程成本并提供高效的命令行工作流。

0 人收藏 0 人点赞

#deepseek

@BohuTANG: 在研发 Evot 过程中发现，要让 Anthropic（Opus 系列）模型发挥到极致，官方 Claude Code 的做法基本是最优解，很难绕过。对 Claude Code prompt 做了深度分析和量化验证，发现他们在训练阶段就把…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

在研发Evot过程中发现，要让Anthropic Opus模型发挥极致，官方Claude Code的方法是最优解，因为训练时将Agent Harness行为模式编入了权重，而非纯prompt工程；未来Agent Harness竞争将把行为下沉到模型层。

0 人收藏 0 人点赞

#deepseek

/advisor 模式: 开源 Python 编码代理，在决策点将廉价工作模型与昂贵审查模型配对（无需支付整个会话的 Opus 费用）

Reddit r/AI_Agents ↗ · 2026-05-23

ClawCodex 是一个开源的 Python 编码代理，实现了 /advisor 模式，在决策点将廉价的工作模型与昂贵的审查模型配对，以降低成本同时保持质量。它支持多个提供商，并在 SWE-bench Verified 上达到 58.2% 的分数。

0 人收藏 0 人点赞

#deepseek

@pritipatelfgoo: Claude Code 永久免费用！这个开源神器 free-claude-code 通过把流量代理到 DeepSeek、Kimi、NVIDIA NIM、OpenRouter、Ollama 本地模型等 10+ 免费/本地后端，实现0费用使…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

free-claude-code 是一个开源工具，通过将 Claude Code 的流量代理到 DeepSeek、Kimi、Ollama 等10多个免费或本地后端，实现永久免费使用 Claude Code，支持 CLI、VSCode、JetBrains 和 Discord。

0 人收藏 0 人点赞

#deepseek

@Soranlan: https://x.com/sweexx9/status/2057560520916414628/video/1… 这个项目肯定会火，但一定要谨慎看。有人做了个 GitHub repo，把 Claude Code 的流量重定向到 Dee…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

介绍了一个将Claude Code流量重定向到DeepSeek、Kimi等十多个免费模型的GitHub repo，已有2万开发者使用。文章强调该工具揭示了前端交互、工作流、模型供应商等各层可替换的趋势。

0 人收藏 0 人点赞

#deepseek

本地压缩的助益

Reddit r/AI_Agents ↗ · 2026-05-22

一位用户分享了一个技巧：在代理工作流程中使用 Ollama 本地的 llama3.1:8b 模型压缩对话上下文，相较于将上下文发送给提供商，能降低延迟并减少 token 使用量。

0 人收藏 0 人点赞

#deepseek

@bookwormengr: https://x.com/bookwormengr/status/2057909493250539891

X AI KOLs Timeline ↗ · 2026-05-22 缓存

对DeepSeek长期战略的分析，认为其在MoE、GRPO和KV缓存缩减方面的创新旨在构建一个10万亿美元的中国AI硬件生态系统，而不是销售即时应用，可能实现1万亿美元的估值。

0 人收藏 0 人点赞

#deepseek

@heyshrutimishra: 难以置信…… DeepSeek 刚刚将 75% 折扣永久化。

X AI KOLs Following ↗ · 2026-05-22 缓存

DeepSeek 已将 DeepSeek-V4-Pro 的 75% 折扣永久化，鼓励用户使用该模型进行构建。

0 人收藏 0 人点赞

#deepseek

使用 ml-intern 和 DeepSeek v4 Flash 训练了一个提示注入检测器，运行在浏览器中

Reddit r/LocalLLaMA ↗ · 2026-05-22

使用 ml-intern 和 DeepSeek V4 Flash 训练了一个提示注入分类器，使用 DistilBERT 实现 F1 99%，优化至 ONNX int8（约 65 MB），可通过 Transformers.js v3 在浏览器中运行。

0 人收藏 0 人点赞

#deepseek

@deepseek_ai: 我们正在将折扣永久化！尽情使用 DeepSeek-V4-Pro 进行构建，将您的创新想法变为现实！

X AI KOLs Following ↗ · 2026-05-22 缓存

DeepSeek 将 DeepSeek-V4-Pro 的折扣永久化，有效期延长至 2026 年 5 月 31 日。

0 人收藏 0 人点赞

deepseek

提交意见反馈