deepseek

#deepseek

GLM 5.2 on Dual Strix Halo (256GB): Worth it?

Reddit r/LocalLLaMA ↗ · 11小时前缓存

本文评测了在双Strix Halo（256GB显存）上运行GLM 5.2（IQ2M量化版本）的性能，生成速度仅约7 token/s，编码任务耗时是DeepSeek V4 Flash的两倍，性价比远不如其他模型，因此不建议在此硬件配置下使用。

0 人收藏 0 人点赞

#deepseek

DeepSeek Flash 刚刚颠覆了智能体市场：成本降低 100 倍的智能体

Reddit r/AI_Agents ↗ · 14小时前

DeepSeek Flash 是一款新的人工智能模型，能够将构建 AI 智能体的成本大幅降低 100 倍，可能彻底改变智能体市场。

0 人收藏 0 人点赞

#deepseek

开源模型令人难以承受的廉价

Hacker News Top ↗ · 15小时前缓存

本文探讨了像DeepSeek V4这样的开源模型与Anthropic和OpenAI的闭源模型之间的巨大成本差异，认为后者是通过人为稀缺性和品牌效应而非技术优势来维持高价格。

0 人收藏 0 人点赞

#deepseek

@Hikari_07_jp：我终于让 DeepSeek-V4-Flash MTP 投机解码在 2× RTX PRO 6000 上实际运行了，单流吞吐量提升 38%。它……

X AI KOLs Timeline ↗ · 22小时前缓存

通过修复加载器中量化格式路由错误，在 2× RTX PRO 6000 上实现了 DeepSeek-V4-Flash MTP 投机解码，吞吐量提升 38%。

0 人收藏 0 人点赞

#deepseek

@Ex0byt: 更新：通往GLM-5.2之路：我们快到了，各位！未量化、未剪枝的DeepSeek-v4-Flash。单台……上11 tok/s

X AI KOLs Timeline ↗ · 昨天缓存

关于在单台DGX Spark上使用sglang推理和自定义mega-kernel以11 tok/s运行未量化的DeepSeek-v4-Flash模型的更新，正在向GLM-5.2迈进。

0 人收藏 0 人点赞

#deepseek

@Fenng: 看到自媒体写的这么一段儿「最新的第四代 WeLM-80B，总参数已经只有 800 亿了，激活 30 亿，激活率只有 3.75%。作为对比——国内极致成本性能的代表 DeepSeek-V4-Flash，总参数 2840 亿、激活 130 亿…

X AI KOLs Timeline ↗ · 2天前缓存

Fenng shares a self-media comparison between the fourth-generation WeLM-80B (80B total params, 3B activated, 3.75% activation rate) and DeepSeek-V4-Flash (284B total, 13B activated, 4.6% activation rate), with a humorous comment.

0 人收藏 0 人点赞

#deepseek

@jakevin7: DeepSeek cache hit 命中率 95%，舒服了。 Maka 在最新一轮的长程任务 Deepseek 模型下的表现太出色了。全跑完接近 18 小时，接近 4 亿 token，33块消耗。 Make builder 们太给力了…

X AI KOLs Timeline ↗ · 2天前缓存

DeepSeek cache hit 高达95%，Maka 桌面AI工作台在长程任务中表现出色，支持多种模型和工具，开源且本地优先。

0 人收藏 0 人点赞

#deepseek

@ashfold: 揭晓一下答案。我们在做dim-agent的benchmark的过程中，发现DSv4的成绩一直在升级。 The whales are cooking!

X AI KOLs Timeline ↗ · 2天前缓存

While running the dim-agent benchmark, the author noticed that DSv4's scores have been consistently improving, hinting at significant progress in model development.

0 人收藏 0 人点赞

#deepseek

@berryxia: 卧槽，这一波直接把DeepSeek的“墙角挖到了啊”！昨晚看到HuggingFace刷到这个有意思的OCR开源模型和原来背后有趣的故事。这个OCR模型直接与传统的OCR模型完全不同！光着速度和精准度真的就无敌了~~ 先说说背景，熟悉…

X AI KOLs Timeline ↗ · 2天前缓存

百度开源了Unlimited OCR模型，采用R-SWA注意力机制，可一次性处理数百页文档，无需分页，KV Cache恒定。该模型创新性地借鉴了人类抄书时的注意力模式，并与DeepSeek OCR有技术渊源，引发了对人才流动的关注。

0 人收藏 0 人点赞

#deepseek

@sheriyuo: 我觉得 @latepostnews 的报道无可争议是中文区第一，不管是之前 DeepSeek 专访、Top Seed 还是这次的大包叙事。他们真的太敢写了，新智元 / 量子位之流完全无法碰瓷，而现在的机器之心也只是在推上蒸馏几个推文 (…

X AI KOLs Timeline ↗ · 3天前缓存

用户@sheriyuo称赞晚点LatePost为中文区最佳AI媒体，批评其他同行如新智元、量子位和机器之心，并提到对DeepSeek等报道的深度。

0 人收藏 0 人点赞

#deepseek

Chunjiang-Intelligence/DeepSeek-v4-Fable

Hugging Face Models Trending ↗ · 3天前缓存

DeepSeek-V4-Fable 是建立在 DeepSeek-V4-Flash 上的 Claude-5-Fable 的蒸馏变体，专为自主进攻性安全研究、CTF 问题解决和受控环境利用规划而设计，具有严格的授权要求。

0 人收藏 0 人点赞

#deepseek

@manateelazycat: 百度这个 AI 黄埔军校来了大神？在 DeepSeek OCR 基础上开源的Unlimited OCR 出手就是王炸在它自己的公布数据里，OmniDocBench v1.5 取得了 93.23 分，超过了 DeepSeek OCR 和…

X AI KOLs Timeline ↗ · 3天前缓存

开源OCR模型Unlimited OCR基于DeepSeek OCR，仅3B参数便在OmniDocBench v1.5上取得93.23分，超越DeepSeek OCR和Gemini 2.5等对手。

0 人收藏 0 人点赞

#deepseek

@VincentLogic: Codex 接第三方模型。最省事的配法：让 Codex 自己配自己。跟它说一句"读一下 ~/.codex/config.toml，帮我加一个 DeepSeek 的自定义模型，别覆盖已有配置，API Key 从环境变量读"。它自己改完配置…

X AI KOLs Timeline ↗ · 3天前缓存

Codex can self-configure to integrate third-party models like DeepSeek and Ollama by reading and modifying its config file automatically.

0 人收藏 0 人点赞

#deepseek

@Fenng: 顺着 Tianyi Cui ( @tianyi )发布的招聘链接看了一下 DeepSeek 现在开放的岗位列表： https://app.mokahr.com/social-recruitment/high-flyer/140576#/j…

X AI KOLs Following ↗ · 4天前缓存

顺着 Tianyi Cui 发布的招聘链接，DeepSeek 正在招聘 AI 技术、基础设施和商务等岗位，并提及薪资问题。

0 人收藏 0 人点赞

#deepseek

@AntCaveClub: Harness 到底是什么 Harness = 评测框架（Evaluation Harness）。在AI领域，"harness"是行业黑话——指一套用来"套住"模型、跑标准化评测的工具。行业标准品是 EleutherAI 的 lm-e…

X AI KOLs Timeline ↗ · 4天前缓存

本文深入解释AI领域评测框架（Harness）的重要性，分析DeepSeek自建Harness团队的战略意义，并对比了开源lm-evaluation-harness与自建系统的区别。

0 人收藏 0 人点赞

#deepseek

@touxnplayai: https://x.com/touxnplayai/status/2068596799888388373

X AI KOLs Timeline ↗ · 4天前缓存

This tutorial explains how to install Codex++ and configure a DeepSeek API key to unlock the full features of Codex AI tool in China, bypassing the need for a ChatGPT account or subscription.

0 人收藏 0 人点赞

#deepseek