Qwen3.6-27B Uncensored Aggressive 发布,附带 K_P 量化!

Reddit r/LocalLLaMA 模型

摘要

社区释出去除安全拒答的 Qwen3.6-27B,并以专为 llama.cpp 与 LM Studio 优化的 K_P GGUF 量化格式打包。

35B-A3B 的稠密兄弟来了——**Qwen3.6 27B Uncensored Aggressive 正式上线!**<br> **Aggressive = 零拒答;人格未做任何改动,就是原版 Qwen 彻底去限制。** [HuggingFace 仓库](https://huggingface.co/HauhauCS/Qwen3.6-27B-Uncensored-HauhauCS-Aggressive) 0/465 次拒答\*,能力零损失。我实测:无循环、无退化,一切正常。 与 35B-A3B 相比,该模型对提示清晰度更敏感。模糊/欠定义的提示容易跑题,务必把格式、约束、范围写清楚,就能稳稳当当。 个人感觉它是“编码/STEM 优先”的模型,社交场景表现偏直。 想关闭“思考”需改 jinja 模板或传参 `{"enable_thinking": false}`。注意 Qwen3.6 不再支持 Qwen3 的 `/think` `/no_think` 软开关,只能用该参数。 包含的量化: - Q8_K_P, Q6_K_P, Q5_K_P, Q4_K_P, IQ4_XS, Q3_K_P, IQ3_M, IQ3_XS, Q2_K_P, IQ2_M - 视觉支持 mmproj - 全部使用 imatrix 生成 K_P 量化速览(错过 MoE 发布的看这里):<br> 基于模型专属分析,在关键处保质量,**每个模型都有独立优化 profile**,相当于提升 1-2 档量化精度,文件只大 5-15%。完全兼容 llama.cpp、LM Studio 等 GGUF 读取器(Ollama 可能要多折腾)。 关键规格: - 27B 稠密 - 64 层 —— 16×(3×DeltaNet + 1×Gated Attention) - 48 线性注意力 + 16 全 softmax 注意力(3:1,与 MoE 相同) - 原生 262 K 上下文,YaRN 可扩到约 1 M(llama.cpp 的 YaRN 是静态的,短文本性能可能掉) - 多模态:文本 + 图片 + 视频 我用的采样参数:<br> `temp=1.0, top_k=20, top_p=0.95, min_p=0, presence_penalty=0, repetition_penalty=1.0`<br> (Qwen 3.6 官方更新:thinking 模式 presence_penalty 用 0.0,而非 3.5 的 1.5;非 thinking 模式仍建议 1.5。完整设置见 HF README。) 提示:<br> - llama.cpp 请加 `--jinja` 标志 - LM Studio 的量化列可能显示“?”,纯属界面问题,模型可正常加载运行 - HF 的硬件兼容小部件也不识 K_P,点“View +X variants”或直接去 Files 标签下载 全部模型:[HuggingFace-HauhauCS](https://huggingface.co/HauhauCS/models) 新建 Discord 服务器,链接在 HF 仓库,欢迎加入获取更新、路线图或闲聊。 祝大家用得开心!<br> \* 经自动+人工拒答基准测试均未发现;发布较仓促,如遇到阻碍使用的拒答,[进 Discord](https://discord.gg/SZ5vacTXYf) 反馈,我会在后续版本修正。
查看原文

相似文章

Qwen3.6-27B-GGUF 重磅发布!

Reddit r/LocalLLaMA

社区 GGUF 版本上线,Qwen 27B 混合架构模型支持 262K 上下文、多模态输入、工具调用,并保留“思考过程”,专为智能体编程而生。