deepseek

标签

Cards List
#deepseek

GLM 5.2 on Dual Strix Halo (256GB): Worth it?

Reddit r/LocalLLaMA · 11小时前 缓存

本文评测了在双Strix Halo(256GB显存)上运行GLM 5.2(IQ2M量化版本)的性能,生成速度仅约7 token/s,编码任务耗时是DeepSeek V4 Flash的两倍,性价比远不如其他模型,因此不建议在此硬件配置下使用。

0 人收藏 0 人点赞
#deepseek

DeepSeek Flash 刚刚颠覆了智能体市场:成本降低 100 倍的智能体

Reddit r/AI_Agents · 14小时前

DeepSeek Flash 是一款新的人工智能模型,能够将构建 AI 智能体的成本大幅降低 100 倍,可能彻底改变智能体市场。

0 人收藏 0 人点赞
#deepseek

开源模型令人难以承受的廉价

Hacker News Top · 15小时前 缓存

本文探讨了像DeepSeek V4这样的开源模型与Anthropic和OpenAI的闭源模型之间的巨大成本差异,认为后者是通过人为稀缺性和品牌效应而非技术优势来维持高价格。

0 人收藏 0 人点赞
#deepseek

@Hikari_07_jp:我终于让 DeepSeek-V4-Flash MTP 投机解码在 2× RTX PRO 6000 上实际运行了,单流吞吐量提升 38%。它……

X AI KOLs Timeline · 22小时前 缓存

通过修复加载器中量化格式路由错误,在 2× RTX PRO 6000 上实现了 DeepSeek-V4-Flash MTP 投机解码,吞吐量提升 38%。

0 人收藏 0 人点赞
#deepseek

@Ex0byt: 更新:通往GLM-5.2之路:我们快到了,各位!未量化、未剪枝的DeepSeek-v4-Flash。单台……上11 tok/s

X AI KOLs Timeline · 昨天 缓存

关于在单台DGX Spark上使用sglang推理和自定义mega-kernel以11 tok/s运行未量化的DeepSeek-v4-Flash模型的更新,正在向GLM-5.2迈进。

0 人收藏 0 人点赞
#deepseek

@Fenng: 看到自媒体写的这么一段儿「最新的第四代 WeLM-80B,总参数已经只有 800 亿了,激活 30 亿,激活率只有 3.75%。作为对比——国内极致成本性能的代表 DeepSeek-V4-Flash,总参数 2840 亿、激活 130 亿…

X AI KOLs Timeline · 2天前 缓存

Fenng shares a self-media comparison between the fourth-generation WeLM-80B (80B total params, 3B activated, 3.75% activation rate) and DeepSeek-V4-Flash (284B total, 13B activated, 4.6% activation rate), with a humorous comment.

0 人收藏 0 人点赞
#deepseek

@jakevin7: DeepSeek cache hit 命中率 95%,舒服了。 Maka 在最新一轮的长程任务 Deepseek 模型下的表现太出色了。 全跑完接近 18 小时,接近 4 亿 token,33块消耗。 Make builder 们太给力了…

X AI KOLs Timeline · 2天前 缓存

DeepSeek cache hit 高达95%,Maka 桌面AI工作台在长程任务中表现出色,支持多种模型和工具,开源且本地优先。

0 人收藏 0 人点赞
#deepseek

@ashfold: 揭晓一下答案。 我们在做dim-agent的benchmark的过程中,发现DSv4的成绩一直在升级。 The whales are cooking!

X AI KOLs Timeline · 2天前 缓存

While running the dim-agent benchmark, the author noticed that DSv4's scores have been consistently improving, hinting at significant progress in model development.

0 人收藏 0 人点赞
#deepseek

@berryxia: 卧槽,这一波直接把DeepSeek的“墙角挖到了啊”! 昨晚看到HuggingFace刷到这个有意思的OCR开源模型和原来背后有趣的故事。 这个OCR模型直接与传统的OCR模型完全不同! 光着速度和精准度真的就无敌了~~ 先说说背景,熟悉…

X AI KOLs Timeline · 2天前 缓存

百度开源了Unlimited OCR模型,采用R-SWA注意力机制,可一次性处理数百页文档,无需分页,KV Cache恒定。该模型创新性地借鉴了人类抄书时的注意力模式,并与DeepSeek OCR有技术渊源,引发了对人才流动的关注。

0 人收藏 0 人点赞
#deepseek

@sheriyuo: 我觉得 @latepostnews 的报道无可争议是中文区第一,不管是之前 DeepSeek 专访、Top Seed 还是这次的大包叙事。 他们真的太敢写了,新智元 / 量子位之流完全无法碰瓷,而现在的机器之心也只是在推上蒸馏几个推文 (…

X AI KOLs Timeline · 3天前 缓存

用户@sheriyuo称赞晚点LatePost为中文区最佳AI媒体,批评其他同行如新智元、量子位和机器之心,并提到对DeepSeek等报道的深度。

0 人收藏 0 人点赞
#deepseek

Chunjiang-Intelligence/DeepSeek-v4-Fable

Hugging Face Models Trending · 3天前 缓存

DeepSeek-V4-Fable 是建立在 DeepSeek-V4-Flash 上的 Claude-5-Fable 的蒸馏变体,专为自主进攻性安全研究、CTF 问题解决和受控环境利用规划而设计,具有严格的授权要求。

0 人收藏 0 人点赞
#deepseek

@manateelazycat: 百度这个 AI 黄埔军校来了大神? 在 DeepSeek OCR 基础上开源的Unlimited OCR 出手就是王炸 在它自己的公布数据里,OmniDocBench v1.5 取得了 93.23 分,超过了 DeepSeek OCR 和…

X AI KOLs Timeline · 3天前 缓存

开源OCR模型Unlimited OCR基于DeepSeek OCR,仅3B参数便在OmniDocBench v1.5上取得93.23分,超越DeepSeek OCR和Gemini 2.5等对手。

0 人收藏 0 人点赞
#deepseek

@VincentLogic: Codex 接第三方模型。最省事的配法:让 Codex 自己配自己。 跟它说一句"读一下 ~/.codex/config.toml,帮我加一个 DeepSeek 的自定义模型,别覆盖已有配置,API Key 从环境变量读"。它自己改完配置…

X AI KOLs Timeline · 3天前 缓存

Codex can self-configure to integrate third-party models like DeepSeek and Ollama by reading and modifying its config file automatically.

0 人收藏 0 人点赞
#deepseek

@Fenng: 顺着 Tianyi Cui ( @tianyi )发布的招聘链接看了一下 DeepSeek 现在开放的岗位列表: https://app.mokahr.com/social-recruitment/high-flyer/140576#/j…

X AI KOLs Following · 4天前 缓存

顺着 Tianyi Cui 发布的招聘链接,DeepSeek 正在招聘 AI 技术、基础设施和商务等岗位,并提及薪资问题。

0 人收藏 0 人点赞
#deepseek

@AntCaveClub: Harness 到底是什么 Harness = 评测框架(Evaluation Harness)。 在AI领域,"harness"是行业黑话——指一套用来"套住"模型、跑标准化评测的工具。 行业标准品是 EleutherAI 的 lm-e…

X AI KOLs Timeline · 4天前 缓存

本文深入解释AI领域评测框架(Harness)的重要性,分析DeepSeek自建Harness团队的战略意义,并对比了开源lm-evaluation-harness与自建系统的区别。

0 人收藏 0 人点赞
#deepseek

@touxnplayai: https://x.com/touxnplayai/status/2068596799888388373

X AI KOLs Timeline · 4天前 缓存

This tutorial explains how to install Codex++ and configure a DeepSeek API key to unlock the full features of Codex AI tool in China, bypassing the need for a ChatGPT account or subscription.

0 人收藏 0 人点赞
#deepseek

@QingQ77: 基于 DeepSeek API 的 MCP 网页搜索服务 https://github.com/chengx-coding/forever-saint-liang-websearch… 为 MCP 兼容客户端(Claude Code、Op…

X AI KOLs Timeline · 5天前 缓存

基于 DeepSeek API 的 MCP 网页搜索服务,为 MCP 兼容客户端(如 Claude Code、OpenCode)提供网页搜索能力,避免依赖第三方搜索服务,仅需一个 DeepSeek API Key 即可使用。

0 人收藏 0 人点赞
#deepseek

Deepseek, Kimi 等

Reddit r/AI_Agents · 5天前

提及 AI 模型 Deepseek 和 Kimi,可能讨论最近的更新或比较。

0 人收藏 0 人点赞
#deepseek

@Fenng: 微信的 AI Agent 已经来了,产品名字「小微」,主模型用的 WeLM,部分回答用 DeepSeek 兜底,已经开始灰度。

X AI KOLs Following · 5天前

微信推出AI Agent产品「小微」,主模型使用WeLM,部分回答由DeepSeek兜底,已开始灰度测试。

0 人收藏 0 人点赞
#deepseek

@Xudong07452910: 当 AI 开始自主研究 AI,真正开源的可能不是代码,而是一套科研协议。 DeepSeek 研究员陈德里开源的 Deli AutoResearch SKILL,很值得看,它是让 AI 长期做研究的运行规则。 它不是一个复杂代码库,而是一份…

X AI KOLs Timeline · 5天前 缓存

DeepSeek研究员陈德里开源了Deli AutoResearch SKILL,这是一份SKILL.md协议文件,定义了AI长期自主研究的运行规则,包括状态持久化、停滞检测、心跳机制等,旨在将自主科研从愿景拆解为可持续运行的工程化闭环。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈