@cjzafir:Qwen 3.5 4B 和 8B 模型太棒了。我今天微调了一个 4B 模型,在全精度和 Q8 量化版本上达到了 98% 的准确率…

X AI KOLs Timeline 新闻

摘要

一位开发者报告称,使用 Unsloth 微调 Qwen 3.5 4B 和 8B 模型后取得了高准确率,这表明业界正转向针对细分任务使用专用的专家语言模型(ELMs)。

Qwen 3.5 4B 和 8B 模型实在太强了。我今天微调了一个 4B 模型,在全精度和 Q8 量化版本上均达到了 98% 的准确率。即便是 Q4 量化版本,质量损失也仅为 1%。我的技术栈如下: > Codex 5.5 作为规划/协调器 > Deepseek v4 pro 生成示例 > Collab pro 提供 A100 GPU > Unsloth 提供微调方案 随后 Codex 运行了 8-9 个小时以完成各个阶段: - 基础架构清晰化 - 数据集创建 - 质量门控 - 微调 - 运行评估 - 量化 - 测试/报告 有时让人觉得有趣的是,如今微调 5B 到 10B 参数规模的模型变得如此容易,并且在特定细分环境中能够击败二线最先进(SoTA)模型。我拥有能够轻松超越 Gemini 3 pro、Sonnet 4.6、GPT-4.5 mini 的模型。现在我们正转向使用专家语言模型(ELMs),而不是将所有任务都扔给大型语言模型(LLMs)。毕竟你不会到处都开保时捷!为企业打造“凯美瑞”,才能赚到钱。
查看原文

相似文章

Qwen 3.6 27B 在 DeepSWE 上的表现

Reddit r/LocalLLaMA

Qwen 3.6 27B 在 DeepSWE 基准测试中获得了 2% 的分数,排名 18/20,高于 Haiku 4.5 和 Minimax M2.7,突显了本地模型与前沿模型之间的差距。

Qwen3.6-27B

Reddit r/LocalLLaMA

阿里巴巴 Qwen 团队发布 270 亿参数新语言模型 Qwen3.6-27B,并公布基准测试结果。