关于用于本地编码的 Qwen-3.6 14B 和 9B 蒸馏模型有任何消息(或希望)吗?
摘要
作者询问是否有针对本地编码用途的 Qwen-3.6 模型 9B 和 14B 蒸馏变体,并提到了在有限硬件上使用 Qwen-3.5 9B 时遇到的具体工具调用和文件结构问题。
正如其标题所示。我目前正在测试(取得了一些成功,但也遇到了一些挑战)在一台配备 RTX 1000 6GB 显存的新工作笔记本上使用 Qwen-3.5 9B(我知道这在当今看来似乎是个笑话)。我使用 `pi` 作为终端编码框架。我在 Qwen-3.5 9B 上面临的问题是,遇到了一些(相对较少见)的问题,包括:1. 它如何处理目录/文件夹——不止一次,奇怪的是,最终代码/测试工件生成了深层嵌套的文件夹结构;2. 它将测试运行识别为失败,而实际上它是成功的。当相同的提示用于 gemini-2.5-flash 和 gemini-2.5-flash-lite 时,并未出现此类问题,这表明问题可能不出在 `pi` 上。我读到一些报告称 `pi` 有时在与 Qwen-3.5 进行工具调用时会出现困难,而这显然在 Qwen-3.6 中已得到修复。因此,我想知道是否有人听说过 Qwen-3.6-27B 稠密模型的蒸馏版本,包括 9B 和 14B 版本是否也会发布,从而能够在较小的 GPU 上使用。
相似文章
Qwen/Qwen3.6-35B-A3B-FP8
阿里巴巴发布了Qwen3.6-35B-A3B-FP8,这是Qwen3.6的开源权重量化变体,拥有35B参数,通过MoE激活3B,具有改进的智能编码能力和保持思维链的迭代开发特性。
有人用 QwQ-32B 吗?它已经发布超过一年了?Qwen 3.6 27b 基本上取代它了吗?
讨论老款 QwQ-32B 模型相较于 Qwen 3.6 27b 和 Gemma 4 等新替代品是否仍有价值,尤其是在编程任务方面。
@witcheer:这是我测量到的第一个能提升实际Bug修复的Qwen3.6-27B编码调优(!!!)。 - 质量(MMLU/ARC/HellaS…)
一个Qwen3.6-27B的社区微调在SWE-bench上提升了实际Bug修复能力,同时保持了质量,这与导致退化的合成蒸馏不同。
Qwen 3.6 35B A3B 的热度绝非虚名!
作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。
我无法让Qwen3.6 27B超越Qwen-Coder-Next,不确定原因
用户报告称,Qwen-Coder-Next 在实际测试和合成基准测试中均优于 Qwen3.6 27B,尽管其他人称赞 27B,用户寻求关于可能设置问题的建议。