标签
本文评测了在双Strix Halo(256GB显存)上运行GLM 5.2(IQ2M量化版本)的性能,生成速度仅约7 token/s,编码任务耗时是DeepSeek V4 Flash的两倍,性价比远不如其他模型,因此不建议在此硬件配置下使用。
DeepSeek Flash 是一款新的人工智能模型,能够将构建 AI 智能体的成本大幅降低 100 倍,可能彻底改变智能体市场。
本文探讨了像DeepSeek V4这样的开源模型与Anthropic和OpenAI的闭源模型之间的巨大成本差异,认为后者是通过人为稀缺性和品牌效应而非技术优势来维持高价格。
通过修复加载器中量化格式路由错误,在 2× RTX PRO 6000 上实现了 DeepSeek-V4-Flash MTP 投机解码,吞吐量提升 38%。
关于在单台DGX Spark上使用sglang推理和自定义mega-kernel以11 tok/s运行未量化的DeepSeek-v4-Flash模型的更新,正在向GLM-5.2迈进。
Fenng shares a self-media comparison between the fourth-generation WeLM-80B (80B total params, 3B activated, 3.75% activation rate) and DeepSeek-V4-Flash (284B total, 13B activated, 4.6% activation rate), with a humorous comment.
DeepSeek cache hit 高达95%,Maka 桌面AI工作台在长程任务中表现出色,支持多种模型和工具,开源且本地优先。
While running the dim-agent benchmark, the author noticed that DSv4's scores have been consistently improving, hinting at significant progress in model development.
百度开源了Unlimited OCR模型,采用R-SWA注意力机制,可一次性处理数百页文档,无需分页,KV Cache恒定。该模型创新性地借鉴了人类抄书时的注意力模式,并与DeepSeek OCR有技术渊源,引发了对人才流动的关注。
用户@sheriyuo称赞晚点LatePost为中文区最佳AI媒体,批评其他同行如新智元、量子位和机器之心,并提到对DeepSeek等报道的深度。
DeepSeek-V4-Fable 是建立在 DeepSeek-V4-Flash 上的 Claude-5-Fable 的蒸馏变体,专为自主进攻性安全研究、CTF 问题解决和受控环境利用规划而设计,具有严格的授权要求。
开源OCR模型Unlimited OCR基于DeepSeek OCR,仅3B参数便在OmniDocBench v1.5上取得93.23分,超越DeepSeek OCR和Gemini 2.5等对手。
Codex can self-configure to integrate third-party models like DeepSeek and Ollama by reading and modifying its config file automatically.
顺着 Tianyi Cui 发布的招聘链接,DeepSeek 正在招聘 AI 技术、基础设施和商务等岗位,并提及薪资问题。
本文深入解释AI领域评测框架(Harness)的重要性,分析DeepSeek自建Harness团队的战略意义,并对比了开源lm-evaluation-harness与自建系统的区别。
This tutorial explains how to install Codex++ and configure a DeepSeek API key to unlock the full features of Codex AI tool in China, bypassing the need for a ChatGPT account or subscription.
基于 DeepSeek API 的 MCP 网页搜索服务,为 MCP 兼容客户端(如 Claude Code、OpenCode)提供网页搜索能力,避免依赖第三方搜索服务,仅需一个 DeepSeek API Key 即可使用。
微信推出AI Agent产品「小微」,主模型使用WeLM,部分回答由DeepSeek兜底,已开始灰度测试。
DeepSeek研究员陈德里开源了Deli AutoResearch SKILL,这是一份SKILL.md协议文件,定义了AI长期自主研究的运行规则,包括状态持久化、停滞检测、心跳机制等,旨在将自主科研从愿景拆解为可持续运行的工程化闭环。