Qwen3.6-27B Uncensored Aggressive 发布,附带 K_P 量化!
摘要
社区释出去除安全拒答的 Qwen3.6-27B,并以专为 llama.cpp 与 LM Studio 优化的 K_P GGUF 量化格式打包。
35B-A3B 的稠密兄弟来了——**Qwen3.6 27B Uncensored Aggressive 正式上线!**<br>
**Aggressive = 零拒答;人格未做任何改动,就是原版 Qwen 彻底去限制。**
[HuggingFace 仓库](https://huggingface.co/HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive) 0/465 次拒答\*,能力零损失。我实测:无循环、无退化,一切正常。
与 35B-A3B 相比,该模型对提示清晰度更敏感。模糊/欠定义的提示容易跑题,务必把格式、约束、范围写清楚,就能稳稳当当。
个人感觉它是“编码/STEM 优先”的模型,社交场景表现偏直。
想关闭“思考”需改 jinja 模板或传参 `{"enable_thinking": false}`。注意 Qwen3.6 不再支持 Qwen3 的 `/think` `/no_think` 软开关,只能用该参数。
包含的量化:
- Q8_K_P, Q6_K_P, Q5_K_P, Q4_K_P, IQ4_XS, Q3_K_P, IQ3_M, IQ3_XS, Q2_K_P, IQ2_M
- 视觉支持 mmproj
- 全部使用 imatrix 生成
K_P 量化速览(错过 MoE 发布的看这里):<br>
基于模型专属分析,在关键处保质量,**每个模型都有独立优化 profile**,相当于提升 1-2 档量化精度,文件只大 5-15%。完全兼容 llama.cpp、LM Studio 等 GGUF 读取器(Ollama 可能要多折腾)。
关键规格:
- 27B 稠密
- 64 层 —— 16×(3×DeltaNet + 1×Gated Attention)
- 48 线性注意力 + 16 全 softmax 注意力(3:1,与 MoE 相同)
- 原生 262 K 上下文,YaRN 可扩到约 1 M(llama.cpp 的 YaRN 是静态的,短文本性能可能掉)
- 多模态:文本 + 图片 + 视频
我用的采样参数:<br>
`temp=1.0, top_k=20, top_p=0.95, min_p=0, presence_penalty=0, repetition_penalty=1.0`<br>
(Qwen 3.6 官方更新:thinking 模式 presence_penalty 用 0.0,而非 3.5 的 1.5;非 thinking 模式仍建议 1.5。完整设置见 HF README。)
提示:<br>
- llama.cpp 请加 `--jinja` 标志
- LM Studio 的量化列可能显示“?”,纯属界面问题,模型可正常加载运行
- HF 的硬件兼容小部件也不识 K_P,点“View +X variants”或直接去 Files 标签下载
全部模型:[HuggingFace-HauhauCS](https://huggingface.co/HauhauCS/models)
新建 Discord 服务器,链接在 HF 仓库,欢迎加入获取更新、路线图或闲聊。
祝大家用得开心!<br>
\* 经自动+人工拒答基准测试均未发现;发布较仓促,如遇到阻碍使用的拒答,[进 Discord](https://discord.gg/SZ5vacTXYf) 反馈,我会在后续版本修正。
相似文章
HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
在 Hugging Face 上发布 Qwen3.6-35B-A3B 模型的无审查激进变体,采用自定义 K_P 量化并完全移除了安全拒绝机制。
@Ex0byt: 各位,这是 Qwen3.6-27B-PRISM-PRO-DQ - 敬请享用!
发布了 Qwen3.6-27B-PRISM-PRO-DQ,这是 Qwen3.6-27B 的动态量化 GGUF 版本,去除了偏见/宣传内容,保留了原生 MTP 草稿头和视觉塔,支持无损推测解码以实现更快的推理。
Qwen3.6-27B-GGUF 重磅发布!
社区 GGUF 版本上线,Qwen 27B 混合架构模型支持 262K 上下文、多模态输入、工具调用,并保留“思考过程”,专为智能体编程而生。
Qwen3.6 35B A3B 无审查异端版原生MTP完整保留发布 KLD 0.0015, 10/100拒绝率 完整19个MTP保留 支持Safetensors、GGUF、NVFP4、NVFP4 GGUF和GPTQ-Int4格式
社区发布的Qwen3.6 35B A3B无审查变体版本,完整保留19个MTP张量,支持多种格式包括Safetensors、GGUF、NVFP4和GPTQ-Int4。
@WaleedAhmad1a10: 查看 Qwen 3.5 27B MoQ 的 GGUF 文件:
Hugging Face 仓库 (kaitchup/Qwen3.6-27B-GGUF-MoQ) 提供了 Qwen3.6-27B MoQ 模型的 GGUF 量化权重,支持使用 llama.cpp 和 Ollama 等工具进行本地推理。