deepseek

标签

Cards List
#deepseek

@Ex0byt: 更新:通往GLM-5.2之路:我们快到了,各位!未量化、未剪枝的DeepSeek-v4-Flash。单台……上11 tok/s

X AI KOLs Timeline · 22小时前 缓存

关于在单台DGX Spark上使用sglang推理和自定义mega-kernel以11 tok/s运行未量化的DeepSeek-v4-Flash模型的更新,正在向GLM-5.2迈进。

0 人收藏 0 人点赞
#deepseek

@Fenng: 看到自媒体写的这么一段儿「最新的第四代 WeLM-80B,总参数已经只有 800 亿了,激活 30 亿,激活率只有 3.75%。作为对比——国内极致成本性能的代表 DeepSeek-V4-Flash,总参数 2840 亿、激活 130 亿…

X AI KOLs Timeline · 昨天 缓存

Fenng shares a self-media comparison between the fourth-generation WeLM-80B (80B total params, 3B activated, 3.75% activation rate) and DeepSeek-V4-Flash (284B total, 13B activated, 4.6% activation rate), with a humorous comment.

0 人收藏 0 人点赞
#deepseek

@jakevin7: DeepSeek cache hit 命中率 95%,舒服了。 Maka 在最新一轮的长程任务 Deepseek 模型下的表现太出色了。 全跑完接近 18 小时,接近 4 亿 token,33块消耗。 Make builder 们太给力了…

X AI KOLs Timeline · 昨天 缓存

DeepSeek cache hit 高达95%,Maka 桌面AI工作台在长程任务中表现出色,支持多种模型和工具,开源且本地优先。

0 人收藏 0 人点赞
#deepseek

@ashfold: 揭晓一下答案。 我们在做dim-agent的benchmark的过程中,发现DSv4的成绩一直在升级。 The whales are cooking!

X AI KOLs Timeline · 昨天 缓存

While running the dim-agent benchmark, the author noticed that DSv4's scores have been consistently improving, hinting at significant progress in model development.

0 人收藏 0 人点赞
#deepseek

@berryxia: 卧槽,这一波直接把DeepSeek的“墙角挖到了啊”! 昨晚看到HuggingFace刷到这个有意思的OCR开源模型和原来背后有趣的故事。 这个OCR模型直接与传统的OCR模型完全不同! 光着速度和精准度真的就无敌了~~ 先说说背景,熟悉…

X AI KOLs Timeline · 昨天 缓存

百度开源了Unlimited OCR模型,采用R-SWA注意力机制,可一次性处理数百页文档,无需分页,KV Cache恒定。该模型创新性地借鉴了人类抄书时的注意力模式,并与DeepSeek OCR有技术渊源,引发了对人才流动的关注。

0 人收藏 0 人点赞
#deepseek

@sheriyuo: 我觉得 @latepostnews 的报道无可争议是中文区第一,不管是之前 DeepSeek 专访、Top Seed 还是这次的大包叙事。 他们真的太敢写了,新智元 / 量子位之流完全无法碰瓷,而现在的机器之心也只是在推上蒸馏几个推文 (…

X AI KOLs Timeline · 2天前 缓存

用户@sheriyuo称赞晚点LatePost为中文区最佳AI媒体,批评其他同行如新智元、量子位和机器之心,并提到对DeepSeek等报道的深度。

0 人收藏 0 人点赞
#deepseek

@manateelazycat: 百度这个 AI 黄埔军校来了大神? 在 DeepSeek OCR 基础上开源的Unlimited OCR 出手就是王炸 在它自己的公布数据里,OmniDocBench v1.5 取得了 93.23 分,超过了 DeepSeek OCR 和…

X AI KOLs Timeline · 2天前 缓存

开源OCR模型Unlimited OCR基于DeepSeek OCR,仅3B参数便在OmniDocBench v1.5上取得93.23分,超越DeepSeek OCR和Gemini 2.5等对手。

0 人收藏 0 人点赞
#deepseek

@VincentLogic: Codex 接第三方模型。最省事的配法:让 Codex 自己配自己。 跟它说一句"读一下 ~/.codex/config.toml,帮我加一个 DeepSeek 的自定义模型,别覆盖已有配置,API Key 从环境变量读"。它自己改完配置…

X AI KOLs Timeline · 2天前 缓存

Codex can self-configure to integrate third-party models like DeepSeek and Ollama by reading and modifying its config file automatically.

0 人收藏 0 人点赞
#deepseek

@Fenng: 顺着 Tianyi Cui ( @tianyi )发布的招聘链接看了一下 DeepSeek 现在开放的岗位列表: https://app.mokahr.com/social-recruitment/high-flyer/140576#/j…

X AI KOLs Following · 3天前 缓存

顺着 Tianyi Cui 发布的招聘链接,DeepSeek 正在招聘 AI 技术、基础设施和商务等岗位,并提及薪资问题。

0 人收藏 0 人点赞
#deepseek

@AntCaveClub: Harness 到底是什么 Harness = 评测框架(Evaluation Harness)。 在AI领域,"harness"是行业黑话——指一套用来"套住"模型、跑标准化评测的工具。 行业标准品是 EleutherAI 的 lm-e…

X AI KOLs Timeline · 3天前 缓存

本文深入解释AI领域评测框架(Harness)的重要性,分析DeepSeek自建Harness团队的战略意义,并对比了开源lm-evaluation-harness与自建系统的区别。

0 人收藏 0 人点赞
#deepseek

@touxnplayai: https://x.com/touxnplayai/status/2068596799888388373

X AI KOLs Timeline · 3天前 缓存

This tutorial explains how to install Codex++ and configure a DeepSeek API key to unlock the full features of Codex AI tool in China, bypassing the need for a ChatGPT account or subscription.

0 人收藏 0 人点赞
#deepseek

@QingQ77: 基于 DeepSeek API 的 MCP 网页搜索服务 https://github.com/chengx-coding/forever-saint-liang-websearch… 为 MCP 兼容客户端(Claude Code、Op…

X AI KOLs Timeline · 4天前 缓存

基于 DeepSeek API 的 MCP 网页搜索服务,为 MCP 兼容客户端(如 Claude Code、OpenCode)提供网页搜索能力,避免依赖第三方搜索服务,仅需一个 DeepSeek API Key 即可使用。

0 人收藏 0 人点赞
#deepseek

Deepseek, Kimi 等

Reddit r/AI_Agents · 4天前

提及 AI 模型 Deepseek 和 Kimi,可能讨论最近的更新或比较。

0 人收藏 0 人点赞
#deepseek

@Fenng: 微信的 AI Agent 已经来了,产品名字「小微」,主模型用的 WeLM,部分回答用 DeepSeek 兜底,已经开始灰度。

X AI KOLs Following · 4天前

微信推出AI Agent产品「小微」,主模型使用WeLM,部分回答由DeepSeek兜底,已开始灰度测试。

0 人收藏 0 人点赞
#deepseek

@Xudong07452910: 当 AI 开始自主研究 AI,真正开源的可能不是代码,而是一套科研协议。 DeepSeek 研究员陈德里开源的 Deli AutoResearch SKILL,很值得看,它是让 AI 长期做研究的运行规则。 它不是一个复杂代码库,而是一份…

X AI KOLs Timeline · 4天前 缓存

DeepSeek研究员陈德里开源了Deli AutoResearch SKILL,这是一份SKILL.md协议文件,定义了AI长期自主研究的运行规则,包括状态持久化、停滞检测、心跳机制等,旨在将自主科研从愿景拆解为可持续运行的工程化闭环。

0 人收藏 0 人点赞
#deepseek

‘禁止挖人’:中国AI巨头DeepSeek据报要求投资者承诺不挖角(3分钟阅读)

TLDR AI · 5天前 缓存

据报,DeepSeek在其74亿美元融资轮中,要求投资者承诺不挖走其人才,凸显了中国人工智能工程师领域的激烈竞争。

0 人收藏 0 人点赞
#deepseek

@ciruai:在配备128GB内存的AMD Ryzen AI Max+ 395 Strix Halo上测试DeepSeek v4 Flash。在中等长度上下文中获得约15 TPS……

X AI KOLs Timeline · 6天前 缓存

在配备128GB内存的AMD Ryzen AI Max+ 395上测试DeepSeek v4 Flash,本地运行284B MoE模型(13B活跃参数)可达约15 TPS。成本仅需3000美元,而数据中心配置需25000美元以上,凸显了在消费级硬件上运行大型模型的可行性。

0 人收藏 0 人点赞
#deepseek

@NFTCPS: 兄弟们,用 DeepSeek V4 Pro 跑 Codex 的,token 烧得心疼吧?这俩 skill 你必须知道。 token-saver:改完代码只回个路径加 done,废话一句没有,实测能省 60-80% token memory…

X AI KOLs Timeline · 6天前 缓存

为DeepSeek V4 Pro优化的Codex技能,通过冻结skill文件和极简输出可节省60-80% token,并提供跨对话持久记忆功能。

0 人收藏 0 人点赞
#deepseek

DeepSeek 推出视觉功能

Hacker News Top · 6天前

DeepSeek 宣布推出新的视觉功能,很可能是一个视觉语言模型,拓展其人工智能服务。

0 人收藏 0 人点赞
#deepseek

@anxue201: https://x.com/anxue201/status/2067477109816050119

X AI KOLs Timeline · 6天前 缓存

一篇详细的配置指南,教用户如何通过开源代理工具CC Switch将OpenAI Codex接入DeepSeek等第三方模型,解决协议不兼容问题。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈