@rohanpaul_ai: 按模型规模划分的下载份额:DeepSeek vs Qwen。DeepSeek在250B+段占主导(47%),而Qwen在10B以下领先…
摘要
下载份额对比显示,DeepSeek在250B+段占主导(47%),而Qwen在10B以下段领先(44%),凸显了两个模型家族之间的互补专业化。
按模型规模划分的下载份额:DeepSeek vs Qwen。DeepSeek在250B+段占主导(47%),Qwen在10B以下段领先(44%),展现出互补的专业化。 https://t.co/L2peDophg6
查看缓存全文
缓存时间: 2026/07/04 16:53
按模型大小划分的下载份额对比:DeepSeek vs. Qwen。DeepSeek在250B+段占主导(47%),而Qwen在sub-10B段领先(44%),显示出互补性的专业化。https://t.co/L2peDophg6
相似文章
@LottoLabs: 对优秀小模型的需求非常大,看看下载量最高的Qwen模型吧,全部<9B
观察到对小AI模型的高需求,体现在Qwen系列9B参数以下模型的下载量上。
Qwen 3.6 27B 在 DeepSWE 上的表现
Qwen 3.6 27B 在 DeepSWE 基准测试中获得了 2% 的分数,排名 18/20,高于 Haiku 4.5 和 Minimax M2.7,突显了本地模型与前沿模型之间的差距。
@rohanpaul_ai: 一篇关于开放模型采用情况的论文发现,以Qwen为首的中国模型现在占据主导地位。中国在开放模型…
本文分析了开放语言模型的采用情况,发现以Qwen为首的中国模型目前在下载量上占据主导地位,到2026年3月已超越美国模型。Qwen的领先优势来自其多样化的模型尺寸,而DeepSeek在超大型模型领域领先,一些美国模型仍显示出强劲的增长势头。
Jackrong/Qwen3.5-9B-DeepSeek-V4-Flash-GGUF
本文档介绍 Qwen3.5-9B-DeepSeek-V4-Flash,这是一款通过知识蒸馏技术将 DeepSeek-V4 的推理能力迁移至 9B 参数小模型中的 AI 模型,旨在实现高效推理。
DeepSpec - deepseek-ai 集合
DeepSeek AI 在 Hugging Face 上发布了 DeepSpec 集合,包含基于 Qwen3 和 Gemma4 的各种尺寸(1B-3B)的推测解码模型(dspark, dflash, eagle3)。