关于用于本地编码的 Qwen-3.6 14B 和 9B 蒸馏模型有任何消息(或希望)吗?

Reddit r/LocalLLaMA 新闻

摘要

作者询问是否有针对本地编码用途的 Qwen-3.6 模型 9B 和 14B 蒸馏变体,并提到了在有限硬件上使用 Qwen-3.5 9B 时遇到的具体工具调用和文件结构问题。

正如其标题所示。我目前正在测试(取得了一些成功,但也遇到了一些挑战)在一台配备 RTX 1000 6GB 显存的新工作笔记本上使用 Qwen-3.5 9B(我知道这在当今看来似乎是个笑话)。我使用 `pi` 作为终端编码框架。我在 Qwen-3.5 9B 上面临的问题是,遇到了一些(相对较少见)的问题,包括:1. 它如何处理目录/文件夹——不止一次,奇怪的是,最终代码/测试工件生成了深层嵌套的文件夹结构;2. 它将测试运行识别为失败,而实际上它是成功的。当相同的提示用于 gemini-2.5-flash 和 gemini-2.5-flash-lite 时,并未出现此类问题,这表明问题可能不出在 `pi` 上。我读到一些报告称 `pi` 有时在与 Qwen-3.5 进行工具调用时会出现困难,而这显然在 Qwen-3.6 中已得到修复。因此,我想知道是否有人听说过 Qwen-3.6-27B 稠密模型的蒸馏版本,包括 9B 和 14B 版本是否也会发布,从而能够在较小的 GPU 上使用。
查看原文

相似文章

Qwen/Qwen3.6-35B-A3B-FP8

Hugging Face Models Trending

阿里巴巴发布了Qwen3.6-35B-A3B-FP8,这是Qwen3.6的开源权重量化变体,拥有35B参数,通过MoE激活3B,具有改进的智能编码能力和保持思维链的迭代开发特性。

Qwen 3.6 35B A3B 的热度绝非虚名!

Reddit r/LocalLLaMA

作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。