Qwen3.6-27B Uncensored Aggressive 发布，附带 K_P 量化！

Reddit r/LocalLLaMA 2026/04/22 18:20 模型

摘要

社区释出去除安全拒答的 Qwen3.6-27B，并以专为 llama.cpp 与 LM Studio 优化的 K_P GGUF 量化格式打包。

35B-A3B 的稠密兄弟来了——**Qwen3.6 27B Uncensored Aggressive 正式上线！** **Aggressive = 零拒答；人格未做任何改动，就是原版 Qwen 彻底去限制。** [HuggingFace 仓库](https://huggingface.co/HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive) 0/465 次拒答\*，能力零损失。我实测：无循环、无退化，一切正常。与 35B-A3B 相比，该模型对提示清晰度更敏感。模糊/欠定义的提示容易跑题，务必把格式、约束、范围写清楚，就能稳稳当当。个人感觉它是“编码/STEM 优先”的模型，社交场景表现偏直。想关闭“思考”需改 jinja 模板或传参 `{"enable_thinking": false}`。注意 Qwen3.6 不再支持 Qwen3 的 `/think` `/no_think` 软开关，只能用该参数。包含的量化： - Q8_K_P, Q6_K_P, Q5_K_P, Q4_K_P, IQ4_XS, Q3_K_P, IQ3_M, IQ3_XS, Q2_K_P, IQ2_M - 视觉支持 mmproj - 全部使用 imatrix 生成 K_P 量化速览（错过 MoE 发布的看这里）： 基于模型专属分析，在关键处保质量，**每个模型都有独立优化 profile**，相当于提升 1-2 档量化精度，文件只大 5-15%。完全兼容 llama.cpp、LM Studio 等 GGUF 读取器（Ollama 可能要多折腾）。关键规格： - 27B 稠密 - 64 层 —— 16×(3×DeltaNet + 1×Gated Attention) - 48 线性注意力 + 16 全 softmax 注意力（3:1，与 MoE 相同） - 原生 262 K 上下文，YaRN 可扩到约 1 M（llama.cpp 的 YaRN 是静态的，短文本性能可能掉） - 多模态：文本 + 图片 + 视频我用的采样参数： `temp=1.0, top_k=20, top_p=0.95, min_p=0, presence_penalty=0, repetition_penalty=1.0` （Qwen 3.6 官方更新：thinking 模式 presence_penalty 用 0.0，而非 3.5 的 1.5；非 thinking 模式仍建议 1.5。完整设置见 HF README。）提示： - llama.cpp 请加 `--jinja` 标志 - LM Studio 的量化列可能显示“?”，纯属界面问题，模型可正常加载运行 - HF 的硬件兼容小部件也不识 K_P，点“View +X variants”或直接去 Files 标签下载全部模型：[HuggingFace-HauhauCS](https://huggingface.co/HauhauCS/models) 新建 Discord 服务器，链接在 HF 仓库，欢迎加入获取更新、路线图或闲聊。祝大家用得开心！ \* 经自动+人工拒答基准测试均未发现；发布较仓促，如遇到阻碍使用的拒答，[进 Discord](https://discord.gg/SZ5vacTXYf) 反馈，我会在后续版本修正。

查看原文

Qwen3.6-27B Uncensored Aggressive 发布，附带 K_P 量化！

相似文章

HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive

@Ex0byt: 各位，这是 Qwen3.6-27B-PRISM-PRO-DQ - 敬请享用！

Qwen3.6-27B-GGUF 重磅发布！

Qwen3.6 35B A3B 无审查异端版原生MTP完整保留发布 KLD 0.0015, 10/100拒绝率完整19个MTP保留支持Safetensors、GGUF、NVFP4、NVFP4 GGUF和GPTQ-Int4格式

@WaleedAhmad1a10: 查看 Qwen 3.5 27B MoQ 的 GGUF 文件：

提交意见反馈