@rohanpaul_ai: 按模型规模划分的下载份额:DeepSeek vs Qwen。DeepSeek在250B+段占主导(47%),而Qwen在10B以下领先…

X AI KOLs Following 新闻

摘要

下载份额对比显示,DeepSeek在250B+段占主导(47%),而Qwen在10B以下段领先(44%),凸显了两个模型家族之间的互补专业化。

按模型规模划分的下载份额:DeepSeek vs Qwen。DeepSeek在250B+段占主导(47%),Qwen在10B以下段领先(44%),展现出互补的专业化。 https://t.co/L2peDophg6
查看原文
查看缓存全文

缓存时间: 2026/07/04 16:53

按模型大小划分的下载份额对比:DeepSeek vs. Qwen。DeepSeek在250B+段占主导(47%),而Qwen在sub-10B段领先(44%),显示出互补性的专业化。https://t.co/L2peDophg6

相似文章

Qwen 3.6 27B 在 DeepSWE 上的表现

Reddit r/LocalLLaMA

Qwen 3.6 27B 在 DeepSWE 基准测试中获得了 2% 的分数,排名 18/20,高于 Haiku 4.5 和 Minimax M2.7,突显了本地模型与前沿模型之间的差距。

Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF

Hugging Face Models Trending

本文档介绍 Qwen3.5-9B-DeepSeek-V4-Flash,这是一款通过知识蒸馏技术将 DeepSeek-V4 的推理能力迁移至 9B 参数小模型中的 AI 模型,旨在实现高效推理。

DeepSpec - deepseek-ai 集合

Reddit r/LocalLLaMA

DeepSeek AI 在 Hugging Face 上发布了 DeepSpec 集合,包含基于 Qwen3 和 Gemma4 的各种尺寸(1B-3B)的推测解码模型(dspark, dflash, eagle3)。