Qwen 3.6 27B AutoRound GGUF,需要您的反馈
摘要
一位用户分享了他们使用AutoRound对Qwen 3.6 27B进行GGUF量化的版本,声称其性能优于其他量化版本,并邀请反馈。
我一直是这个模型的AutoRound量化的粉丝,不知为何,它思考得更少(有点像Qwopus模型),并且比Unsloth量化等更快地提出解决方案。[https://huggingface.co/sphaela/Qwen3.6-27B-AutoRound-GGUF](https://huggingface.co/sphaela/Qwen3.6-27B-AutoRound-GGUF) 我分享给各位,大家可以试试,但老实说,别犹豫,在我的所有测试中,它们一直很可靠,我甚至在MTP量化可用之前就使用过没有MTP的Q6量化,仅仅因为Q6在我的C++编码任务中极其精确。
相似文章
为什么AutoRound被严重忽视?
一位用户质疑为什么AutoRound——这款在低位宽下精度保留出色且能直接导出GGUF的量化工具,尽管在复杂模型(如Qwen3.6 27B)上表现优于标准AWQ和RTN,却仍然被忽视。
DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
基于 Qwen 3.6 27B 模型的社区微调去审查版本,提供高精度 GGUF 量化。
@coffeecup2020: TurboQuant - Qwopus3.6-27B-v2-TQ3_4S.gguf 通过gpqa测试确认,这非常棒。https://huggingface.co/YTan…
TurboQuant 是 Qwopus3.6-27B-v2 模型的 GGUF 量化版本,经 GPQA 测试结果确认,并在 Hugging Face 上分享,感谢 Jackrong 和 KyleHessling。
@WaleedAhmad1a10: 查看 Qwen 3.5 27B MoQ 的 GGUF 文件:
Hugging Face 仓库 (kaitchup/Qwen3.6-27B-GGUF-MoQ) 提供了 Qwen3.6-27B MoQ 模型的 GGUF 量化权重,支持使用 llama.cpp 和 Ollama 等工具进行本地推理。
Qwen 3.6 27B 30GB 相同 top p: 98.358 ± 0.033 % vs UD Q8 K XL 33GB 相同 top p: 97.426 ± 0.041 %
一位社区研究员分享了为Qwen3.6-27B定制的量化方案,通过将高异常值子层保留为BF16格式,生成体积更小的30GB Q8 GGUF模型,在KLD和top-p指标上优于Unsloth的33GB Q8_K_XL变体。