标签
关于在单台DGX Spark上使用sglang推理和自定义mega-kernel以11 tok/s运行未量化的DeepSeek-v4-Flash模型的更新,正在向GLM-5.2迈进。
Fenng shares a self-media comparison between the fourth-generation WeLM-80B (80B total params, 3B activated, 3.75% activation rate) and DeepSeek-V4-Flash (284B total, 13B activated, 4.6% activation rate), with a humorous comment.
DeepSeek cache hit 高达95%,Maka 桌面AI工作台在长程任务中表现出色,支持多种模型和工具,开源且本地优先。
While running the dim-agent benchmark, the author noticed that DSv4's scores have been consistently improving, hinting at significant progress in model development.
百度开源了Unlimited OCR模型,采用R-SWA注意力机制,可一次性处理数百页文档,无需分页,KV Cache恒定。该模型创新性地借鉴了人类抄书时的注意力模式,并与DeepSeek OCR有技术渊源,引发了对人才流动的关注。
用户@sheriyuo称赞晚点LatePost为中文区最佳AI媒体,批评其他同行如新智元、量子位和机器之心,并提到对DeepSeek等报道的深度。
开源OCR模型Unlimited OCR基于DeepSeek OCR,仅3B参数便在OmniDocBench v1.5上取得93.23分,超越DeepSeek OCR和Gemini 2.5等对手。
Codex can self-configure to integrate third-party models like DeepSeek and Ollama by reading and modifying its config file automatically.
顺着 Tianyi Cui 发布的招聘链接,DeepSeek 正在招聘 AI 技术、基础设施和商务等岗位,并提及薪资问题。
本文深入解释AI领域评测框架(Harness)的重要性,分析DeepSeek自建Harness团队的战略意义,并对比了开源lm-evaluation-harness与自建系统的区别。
This tutorial explains how to install Codex++ and configure a DeepSeek API key to unlock the full features of Codex AI tool in China, bypassing the need for a ChatGPT account or subscription.
基于 DeepSeek API 的 MCP 网页搜索服务,为 MCP 兼容客户端(如 Claude Code、OpenCode)提供网页搜索能力,避免依赖第三方搜索服务,仅需一个 DeepSeek API Key 即可使用。
微信推出AI Agent产品「小微」,主模型使用WeLM,部分回答由DeepSeek兜底,已开始灰度测试。
DeepSeek研究员陈德里开源了Deli AutoResearch SKILL,这是一份SKILL.md协议文件,定义了AI长期自主研究的运行规则,包括状态持久化、停滞检测、心跳机制等,旨在将自主科研从愿景拆解为可持续运行的工程化闭环。
据报,DeepSeek在其74亿美元融资轮中,要求投资者承诺不挖走其人才,凸显了中国人工智能工程师领域的激烈竞争。
在配备128GB内存的AMD Ryzen AI Max+ 395上测试DeepSeek v4 Flash,本地运行284B MoE模型(13B活跃参数)可达约15 TPS。成本仅需3000美元,而数据中心配置需25000美元以上,凸显了在消费级硬件上运行大型模型的可行性。
为DeepSeek V4 Pro优化的Codex技能,通过冻结skill文件和极简输出可节省60-80% token,并提供跨对话持久记忆功能。
一篇详细的配置指南,教用户如何通过开源代理工具CC Switch将OpenAI Codex接入DeepSeek等第三方模型,解决协议不兼容问题。