qwen-2-5

标签

Cards List
#qwen-2-5

@TheAhmadOsman: 性能媲美Opus 4.5的3B模型VibeThinker 3B(基于Qwen 2.5)

X AI KOLs Following · 10小时前 缓存

Ahmad Osman宣布了VibeThinker 3B,这是一个基于Qwen 2.5的30亿参数模型,声称性能可与Claude Opus 4.5媲美,并预测可在消费级硬件上进行本地部署。

0 人收藏 0 人点赞
#qwen-2-5

蒸馏有多难?

Reddit r/LocalLLaMA · 2026-05-08

该文章探讨了模型蒸馏的难度和成本,以DeepSeek R1蒸馏到Llama 3 8b和Qwen 2.5 7b为例,询问为何蒸馏模型不常见。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈