deepseek

标签

Cards List
#deepseek

将大型模型卸载到系统内存时的性能表现?

Reddit r/LocalLLaMA · 2026-05-24

讨论了将大型AI模型权重从GPU显存卸载到系统内存时的性能权衡,比较了不同GPU配置(如RTX 5090与RTX6000)在运行DeepSeek V4 Pro等模型时的表现。

0 人收藏 0 人点赞
#deepseek

@seclink: 中国初创公司DeepSeek周五宣布,其DeepSeek-V4-Pro API的75%折扣优惠将永久生效,价格低至每百万缓存输入令牌0.003625美元,输出0.87美元——比OpenAI的GPT-5.5便宜约34倍。 这款拥有1.6万亿…

X AI KOLs Following · 2026-05-24 缓存

DeepSeek宣布其V4-Pro API永久降价75%,每百万缓存输入令牌仅0.003625美元,输出0.87美元,比OpenAI的GPT-5.5便宜约34倍。该模型拥有1.6万亿参数但仅需490亿活跃参数,支持100万令牌上下文,在编码和推理基准测试中表现领先。

0 人收藏 0 人点赞
#deepseek

@Michaelzsguo: KV缓存是模型在生成期间的工作记忆。随着上下文窗口变长,模型必须保留更多…

X AI KOLs Timeline · 2026-05-23 缓存

DeepSeek的KV缓存压缩创新,包括MLA和CSA/HCA,将KV缓存大小减少了93%,实现了高效的长上下文推理和基于SSD的缓存,正如antirez的ds4.c项目所展示的那样。

0 人收藏 0 人点赞
#deepseek

@sheriyuo: 其实我从一开始写 paper 就是纯用 AI 写的,之前用 DeepSeek R1,现在用 V4。因为我不具备英语学术能力,但是我能肉眼看出来这句话、这段话是否合适 对于中文写作,我还是比较有自信的,所以我的第一篇 paper 内几乎 9…

X AI KOLs Timeline · 2026-05-23 缓存

用户分享了自己完全使用AI(DeepSeek R1和V4)撰写学术论文的经验,强调中文大纲和精细的Prompt调优是关键,并指出人工修改AI生成的写作比自行写作更累。

0 人收藏 0 人点赞
#deepseek

@mark_k: 关于DeepSeek AI(@deepseek_ai)的一篇引人入胜且非常深刻的分析文章。你绝对猜不到他们的策略是什么……

X AI KOLs Timeline · 2026-05-23 缓存

对DeepSeek AI非常规策略的分析:优先采用激进架构创新(MoE、MLA、engram、mHC),大幅降低计算和内存需求,从而实现长期布局,构建一个10万亿人民币的中国AI硬件生态系统,并追求1万亿美元估值。

1 人收藏 1 人点赞
#deepseek

@Michaelzsguo: 发现了一个对你的本地LLM推理优化很有用的工具:https://kvcache.ai/tools/kv-cache-ca…

X AI KOLs Timeline · 2026-05-23 缓存

一条推文分享了来自KVCache.ai的KV缓存大小计算器,这是一个用于估算本地LLM推理中KV缓存内存使用量的工具,并强调DeepSeek V4 Pro的100万token仅使用5GB内存。

0 人收藏 0 人点赞
#deepseek

@ivanfioravanti: 给那些想知道在 M5 Max 上本地运行 ds4-agent 并使用 DeepSeek V4 Flash q2-imatrix gguf 模型意味着什么的人…

X AI KOLs Timeline · 2026-05-23 缓存

演示在 M5 Max 上本地运行 ds4-agent 并使用 DeepSeek V4 Flash q2-imatrix gguf 模型,展示了自我更新能力以及与 HF_HOME 的集成以用于 gguf 模型。

0 人收藏 0 人点赞
#deepseek

@rasbt: 感谢一位很棒的新读者贡献,我将 DeepSeek Sparse Attention (DSA) 从头实现的代码添加到了我的 LLMs-from-scratch 仓库中。

X AI KOLs Timeline · 2026-05-23 缓存

Sebastian Raschka 将 DeepSeek Sparse Attention (DSA) 的从头实现添加到了 LLMs-from-scratch 教育仓库中,包括动机、概述以及一个 GPT 风格的参考实现。

0 人收藏 0 人点赞
#deepseek

编码中90%的枯燥任务基本上已被解决

Reddit r/singularity · 2026-05-23

一位开发者分享使用廉价AI模型(DeepSeek v4、Hunyuan Hy3预览版)自动化90%编码任务的经验,而Opus则用于更难的10%,强调了成本和延迟权衡。

0 人收藏 0 人点赞
#deepseek

@GithubProjects: Reasonix 是一款专为 DeepSeek 设计的终端 AI 编程代理,旨在通过稳定前缀缓存降低 token 成本……

X AI KOLs Timeline · 2026-05-23 缓存

Reasonix 是一款针对 DeepSeek 模型优化的终端 AI 编程代理,通过稳定前缀缓存实现了 99.82% 的缓存命中率,并将每次工作负载的 token 成本从约 61 美元降至约 12 美元。

0 人收藏 0 人点赞
#deepseek

@wsl8297: 平时拿 DeepSeek 写代码的人,可以看看 DeepSeek-Code-Whale。 GitHub:https://github.com/usewhale/DeepSeek-Code-Whale… 开源终端 AI 编程 Agent,专…

X AI KOLs Timeline · 2026-05-23 缓存

DeepSeek-Code-Whale 是一个开源的终端 AI 编程代理,专门为 DeepSeek 模型优化,支持 MCP 工具、Skills 扩展、前缀缓存优化(90% 缓存命中率)和 1M 上下文窗口,旨在降低 AI 编程成本并提供高效的命令行工作流。

0 人收藏 0 人点赞
#deepseek

@BohuTANG: 在研发 Evot 过程中发现,要让 Anthropic(Opus 系列)模型发挥到极致,官方 Claude Code 的做法基本是最优解,很难绕过。 对 Claude Code prompt 做了深度分析和量化验证,发现他们在训练阶段就把…

X AI KOLs Timeline · 2026-05-23 缓存

在研发Evot过程中发现,要让Anthropic Opus模型发挥极致,官方Claude Code的方法是最优解,因为训练时将Agent Harness行为模式编入了权重,而非纯prompt工程;未来Agent Harness竞争将把行为下沉到模型层。

0 人收藏 0 人点赞
#deepseek

/advisor 模式: 开源 Python 编码代理,在决策点将廉价工作模型与昂贵审查模型配对(无需支付整个会话的 Opus 费用)

Reddit r/AI_Agents · 2026-05-23

ClawCodex 是一个开源的 Python 编码代理,实现了 /advisor 模式,在决策点将廉价的工作模型与昂贵的审查模型配对,以降低成本同时保持质量。它支持多个提供商,并在 SWE-bench Verified 上达到 58.2% 的分数。

0 人收藏 0 人点赞
#deepseek

@pritipatelfgoo: Claude Code 永久免费用! 这个开源神器 free-claude-code 通过把流量代理到 DeepSeek、Kimi、NVIDIA NIM、OpenRouter、Ollama 本地模型等 10+ 免费/本地后端,实现0费用使…

X AI KOLs Timeline · 2026-05-23 缓存

free-claude-code 是一个开源工具,通过将 Claude Code 的流量代理到 DeepSeek、Kimi、Ollama 等10多个免费或本地后端,实现永久免费使用 Claude Code,支持 CLI、VSCode、JetBrains 和 Discord。

0 人收藏 0 人点赞
#deepseek

@Soranlan: https://x.com/sweexx9/status/2057560520916414628/video/1… 这个项目肯定会火,但一定要谨慎看。 有人做了个 GitHub repo,把 Claude Code 的流量重定向到 Dee…

X AI KOLs Timeline · 2026-05-23 缓存

介绍了一个将Claude Code流量重定向到DeepSeek、Kimi等十多个免费模型的GitHub repo,已有2万开发者使用。文章强调该工具揭示了前端交互、工作流、模型供应商等各层可替换的趋势。

0 人收藏 0 人点赞
#deepseek

本地压缩的助益

Reddit r/AI_Agents · 2026-05-22

一位用户分享了一个技巧:在代理工作流程中使用 Ollama 本地的 llama3.1:8b 模型压缩对话上下文,相较于将上下文发送给提供商,能降低延迟并减少 token 使用量。

0 人收藏 0 人点赞
#deepseek

@bookwormengr: https://x.com/bookwormengr/status/2057909493250539891

X AI KOLs Timeline · 2026-05-22 缓存

对DeepSeek长期战略的分析,认为其在MoE、GRPO和KV缓存缩减方面的创新旨在构建一个10万亿美元的中国AI硬件生态系统,而不是销售即时应用,可能实现1万亿美元的估值。

0 人收藏 0 人点赞
#deepseek

@heyshrutimishra: 难以置信…… DeepSeek 刚刚将 75% 折扣永久化。

X AI KOLs Following · 2026-05-22 缓存

DeepSeek 已将 DeepSeek-V4-Pro 的 75% 折扣永久化,鼓励用户使用该模型进行构建。

0 人收藏 0 人点赞
#deepseek

使用 ml-intern 和 DeepSeek v4 Flash 训练了一个提示注入检测器,运行在浏览器中

Reddit r/LocalLLaMA · 2026-05-22

使用 ml-intern 和 DeepSeek V4 Flash 训练了一个提示注入分类器,使用 DistilBERT 实现 F1 99%,优化至 ONNX int8(约 65 MB),可通过 Transformers.js v3 在浏览器中运行。

0 人收藏 0 人点赞
#deepseek

@deepseek_ai: 我们正在将折扣永久化!尽情使用 DeepSeek-V4-Pro 进行构建,将您的创新想法变为现实!

X AI KOLs Following · 2026-05-22 缓存

DeepSeek 将 DeepSeek-V4-Pro 的折扣永久化,有效期延长至 2026 年 5 月 31 日。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈