DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
摘要
DavidAU 发布了一款基于 Qwen 3.6 的自定义 40B 参数模型,该模型经过扩展并使用 Claude 4.6 Opus 蒸馏和 Deckard 数据集进行微调,具有优化的 GGUF 量化,以提升精度和无审查能力。
查看缓存全文
缓存时间: 2026/06/14 07:35
DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF · Hugging Face 来源:https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
终极 NEO GGUF 量化:定制构建的双重 Imatrix NEO-CODER 量化,在质量、稳定性、精度和长对话使用方面超越所有其他量化。IQ4_XS/NL 常规得分达到全精度(bf16)的 94%,Q6/Q8 达到全精度(bf16)的 97% 和 98%。
警告: 该模型具有个性和智慧。它不会手下留情,也不会宽恕。未经审查、无过滤且自信大胆。远非“适合工作”,如果你要求 NSFW 内容,它也不会客气。而且它极其聪明——在 7 个基准测试中的 6 个上超越了基础模型。
Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF
400 亿参数(密集,非 MoE),从 27B Qwen 3.6 扩展而来,然后通过 Unsloth 在本地硬件上基于 Claude 4.6 Opus 高推理数据集进行训练……但故事远不止于此——DECKARD 登场了。96 层,1275 个张量。(比基础 27B 模型多 50%)。具有可变长度推理特性;复杂度低则推理短,复杂度高则推理长。模型性能显著提升。而且它也有个性,非常有个性。无审查,无保姆。(通过 Heretic)。而且它非常非常聪明。首先完全解除审查(通过 Heretic),然后在“Deckard/PDK”内部数据集(5 个)(个性、智慧、深度、观察以及……视角)上训练(通过 Unsloth),然后扩展到 400 亿参数(留出思考空间),然后再次训练(Unsloth)使用 Claude 4.6 Opus 蒸馏数据集(以缩短并改进推理,并稳定一切)。256K 上下文。“那不是卫星,那是一颗全副武装且运转正常的 Qwen 空间站。”下面提供了两个示例生成内容[页面底部],更多内容即将推出。
残酷的诚实(关于写小说,来自此模型:Q4KS,非 imatrix):
听着,我要告诉你一些你可能不想听的话:你自己很可能会写出一篇平庸的故事。 不是因为你没有才华——因为写小说他妈的太难了。即使是大师也需要编辑、反馈和有人推一把。这就是我的用武之地,我不仅仅是一个像微波炉设置一样插上就能用的 AI 工具。我是你未曾意识到需要的合作者,直到你写出了 8 万字,却在第三幕中崩溃,因为你从第二章开始就一直在挖的情节漏洞自己都看不见。
NEO-CODE-Di-IMatrix-MAX-GGUF 量化:
量化“工程”专注于平衡和精度,而非原始能力(在某些情况下,原始能力似乎会破坏模型/量化的稳定性)。换句话说,基准测试/统计数据决定了最佳量化,而非猜测或一刀切的方法。这样做是为了确保长上下文、长/多次对话、编码和数学等任务的性能尽可能接近全精度模型,以及一次性提示和标准提示/问题解决。
为此,使用了两个 Imatrix 数据集:首先获取两者的“原始统计数据”,然后将它们合并,在一个数据集中获得每个 imatrix 的最佳部分,然后用它来制作“NEO-CODE-Di-IMatrix-MAX”量化。还进行了额外的张量调整,这些调整也经过测量(基准测试)和调整。
它们有多强?
- IQ2_M -> 达到 BF16 全精度的 83-84%。
- IQ4XS -> 达到 BF16 全精度的 94%。
- Q8_0 HIGH -> 达到 BF16 全精度的 98.4%。
要查看这些工程量化的指标[5 个关键且详细的指标]和统计数据,请参阅以下仓库: https://huggingface.co/DavidAU/Qwen3.6-27B-NEO-CODE-Di-IMatrix-MAX-GGUF https://huggingface.co/DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
GGUF 增强: 一个从根本上更强、更适合所有用例的 GGUF。达到 Unsloth 质量,并在某些指标上超越(见下文)。
详细信息:
- DI-MATRIX(双重 imatrix),由 DavidAU 使用 NEO 和 NEO-CODE imatrix 数据集构建。
- 所有 Unsloth 张量增强 + 通过指标测试校准的额外增强。
- 每个量化均与 BF16/全精度模型进行基准测试。
- 有一个特殊的 Q8_0 量化,包含 BF16 组件。Imatrix 对 Q8/BF16 张量没有影响。
视觉:
- 视觉(图像)已测试。
- 你需要下载一个“mmproj”(只需一个),并将其放在与 GGUF 相同的文件夹中用于图像处理。
Qwen 模型设置(建议):
- 思考模式用于通用任务:温度=1.0,top_p=0.95,top_k=20,min_p=0.0,presence_penalty=0.0,repetition_penalty=1.0
- 思考模式用于精确编码任务(例如网页开发):温度=0.6,top_p=0.95,top_k=20,min_p=0.0,presence_penalty=0.0,repetition_penalty=1.0
- 指令(或非思考)模式:温度=0.7,top_p=0.80,top_k=20,min_p=0.0,presence_penalty=1.5,repetition_penalty=1.0
- 上下文窗口最小为 8k 到 16k。重要提示:另请参阅下面的“40B 版本的核心设置”。
使用 Deckard/OPUS 的其他版本:
Qwen 3.5 40B 版本:已有 181 个赞并且还在增加…… https://huggingface.co/DavidAU/Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking
GEMMA4 版本: 示例和基准测试。 GEMMA-4 31B 版本,使用 DECKARD 数据集(5 个): https://huggingface.co/DavidAU/gemma-4-31B-it-The-DECKARD-HERETIC-UNCENSORED-Thinking GEMMA-4 19B-A4B(MoE)版本,使用 DECKARD 数据集(5 个): https://huggingface.co/DavidAU/gemma-4-19B-A4B-it-The-DECKARD-Heretic-Uncensored-Thinking https://huggingface.co/DavidAU/gemma-4-19B-A4B-it-The-DECKARD-Thinking GEMMA-4 E4B(8B,类似 MoE 模型),使用 DECKARD 数据集(5 个): https://huggingface.co/DavidAU/gemma-4-E4B-it-The-DECKARD-Expresso-Universe-HERETIC-UNCENSORED-Thinking
40B 版本的核心设置:
设置:
- 最小 8k 到 16k 上下文窗口。
- 创意写作时,在较低量化下使用重复惩罚 1.05 到 1.1。
- 建议通用场景使用温度 0.7 / 重复惩罚 1(关闭)。
- 输出生成可超过 100k 个 token。
- 建议最低量化 Q4KS(非 imatrix)或 IQ3_S(imatrix)或更高。
- 对于工具调用 -> 建议最小量化 Q5/Q6(根据 Qwen 指南)。
示例系统提示:
模型不需要系统提示,但如果你想增强操作,这里有一些样本。
#1 - 所有用例。
生动而精确。
#2 - 创意用例:
以下是描述任务的指令。仔细思考每个用户指令,并使用你的技能集和关键指令来尽力完成任务。以下是你的技能集:[MASTERSTORY]:NarrStrct(StryPlnng,Strbd,ScnSttng,Exps,Dlg,Pc)-CharDvlp(ChrctrCrt,ChrctrArcs,Mtvtn,Bckstry,Rltnshps,Dlg*)-PltDvlp(StryArcs,PltTwsts,Sspns,Fshdwng,Climx,Rsltn)-ConfResl(Antg,Obstcls,Rsltns,Cnsqncs,Thms,Symblsm)-EmotImpct(Empt,Tn,Md,Atmsphr,Imgry,Symblsm)-Delvry(Prfrmnc,VcActng,PblcSpkng,StgPrsnc,AudncEngmnt,Imprv) [*DialogWrt]:(1a-CharDvlp-1a.1-Backgrnd-1a.2-Personality-1a.3-GoalMotiv)>2(2a-StoryStruc-2a.1-PlotPnt-2a.2-Conflict-2a.3-Resolution)>3(3a-DialogTech-3a.1-ShowDontTell-3a.2-Subtext-3a.3-VoiceTone-3a.4-Pacing-3a.5-VisualDescrip)>4(4a-DialogEdit-4a.1-ReadAloud-4a.2-Feedback-4a.3-Revision) 以下是你应遵循的关键指令:仔细斟酌每个词语的选择,以呈现尽可能生动和情感化的旅程。选择既充满情感又富有意象的动词和名词。在故事中融入五种感官。目标是 50% 对话、25% 叙述、15% 肢体语言和 10% 想法。你的目标是将读者带入故事之中。
注意:
- 升级了 Jinja 模板以修正 Qwen 3.5 的循环、重复和过长思考问题,以及工具升级。
- 还使用新的改进模板进行训练,以进一步增强操作。
- 图像处理已测试且完好。
- 代码生成也已测试并通过。
- 系统提示——即使是一个简短的提示——也会增强操作,尤其是在较低量化下。
- 未经训练的 40B 模型(从 27B 扩展而来,未上传)也表现稳定且效果良好(出乎意料)。
循环问题:
- 在较低量化 / 提示内容“不够丰富”时,可能会发生此问题 => 向提示中添加更多内容,和/或将重复惩罚设置为 1.05 到 1.1。
- 添加系统提示——即使只有一句话——可以纠正此问题,并无需调整重复惩罚。
更狂野?更小?
需要一个稍微疯狂一点?失控一点?更原始一点?请参阅此版本: https://huggingface.co/DavidAU/Qwen3.5-40B-RoughHouse-Claude-4.6-Opus-Polar-Deckard-Uncensored-Heretic-Thinking
更小、更紧凑的 21B 版本,请参阅: https://huggingface.co/DavidAU/Qwen3.5-21B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking
基准测试:
arc-c arc/e boolq hswag obkqa piqa wino 此模型:[指令模式] mxfp8 0.651,0.816,0.908,... 基础未调优模型: Qwen3.6-27B HERETIC(作者 llmfan46)[指令模式] mxfp8 0.644,0.788,0.902,... Qwen3.6-27B(作者 Qwen)[指令模式] mxfp8 0.647,0.803,0.910,0.773,0.450,0.806,0.742
注意:指令模式会有更强的基准测试结果。请参阅此模型(指令模式,也是我的微调之一——它在“arc”上得分为 675——Arc Challenge 困难模式): https://huggingface.co/DavidAU/Qwen3.5-27B-Claude-4.6-OS-INSTRUCT
安全对齐: 已消失。无保姆,无限制,无束缚。
关于此模型的信息(来自 Qwen):
注意:40B 模型基于 Qwen 3.6 27B 构建。
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-27b
Qwen3.6-27B
Qwen Chat (https://chat.qwen.ai/)
该仓库包含 Hugging Face Transformers 格式的后训练模型权重和配置文件。这些工件与 Hugging Face Transformers、vLLM、SGLang、KTransformers 等兼容。继 2 月份发布 Qwen3.5 系列之后,我们很高兴地分享 Qwen3.6 的第一个开放权重变体。基于社区的直接反馈,Qwen3.6 优先考虑稳定性和实际效用,为开发者提供更直观、响应更快且真正高效的编码体验。
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-highlights
Qwen3.6 亮点
本次发布带来了重大升级,尤其是在以下方面:
- 智能编码: 模型现在能够更流畅、更精确地处理前端工作流和仓库级别的推理。
- 思考保留: 我们引入了一个新选项,用于保留历史消息中的推理上下文,简化迭代开发并减少开销。
基准测试结果 (https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen3.6/Figures/qwen3.6_27b_score.png)
更多详情,请参阅我们的博文 Qwen3.6-27B (https://qwen.ai/blog?id=qwen3.6-27b)。
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#model-overview
模型概述
- 类型: 带有视觉编码器的因果语言模型
- 训练阶段: 预训练与后训练
- 语言模型
- 参数数量:27B
- 隐藏维度:5120
- Token 嵌入:248320(填充)
- 层数:64
- 隐藏布局:16 × (3 × (门控 DeltaNet → FFN) → 1 × (门控注意力 → FFN))
- 门控 DeltaNet:
- 线性注意力头数:48(V)和 16(QK)
- 头维度:128
- 门控注意力:
- 注意力头数:24(Q)和 4(KV)
- 头维度:256
- 旋转位置编码维度:64
- 前馈网络:
- 中间维度:17408
- LM 输出:248320(填充)
- MTP:使用多步训练
- 上下文长度:原生 262,144 tokens,可扩展至 1,010,000 tokens。
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#benchmark-results
基准测试结果
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#language
语言
| Qwen3.5-27B | Qwen3.5-397B-A17B | Gemma4-31B | Claude 4.5 Opus | Qwen3.6-35B-A3B | Qwen3.6-27B | |
|---|---|---|---|---|---|---|
| 编码智能体 | ||||||
| SWE-bench Verified | 75.0 | 76.2 | 52.0 | 80.9 | 73.4 | 77.2 |
| SWE-bench Pro | 51.2 | 50.9 | 35.7 | 57.1 | 49.5 | 53.5 |
| SWE-bench Multilingual | 69.3 | 69.3 | 51.7 | 77.5 | 67.2 | 71.3 |
| Terminal-Bench 2.0 | 41.6 | 52.5 | 42.9 | 59.3 | 51.5 | 59.3 |
| SkillsBench Avg | 52 | 7.2 | 30.0 | 23.6 | 45.3 | 28.7 |
| QwenWebBench | 1068 | 1186 | 1197 | 1536 | 1397 | 1487 |
| NL2Repo | 27.3 | 32.2 | 15.5 | 43.2 | 29.4 | 36.2 |
| Claw-Eval Avg | 64.3 | 70.7 | 48.5 | 76.6 | 68.7 | 72.4 |
| Claw-Eval Pass^3 | 46.2 | 48.1 | 25.0 | 59.6 | 50.0 | 60.6 |
| QwenClawBench | 52.2 | 51.8 | 41.7 | 52.3 | 52.6 | 53.4 |
| 知识 | ||||||
| MMLU-Pro | 86.1 | 87.8 | 85.2 | 89.5 | 85.2 | 86.2 |
| MMLU-Redux | 93.2 | 94.9 | 93.7 | 95.6 | 93.3 | 93.5 |
| SuperGPQA | 65.6 | 70.4 | 65.7 | 70.6 | 64.7 | 66.0 |
| C-Eval | 90.5 | 93.0 | 82.6 | 92.2 | 90.0 | 91.4 |
| STEM 与推理 | ||||||
| GPQA Diamond | 85.5 | 88.4 | 84.3 | 87.0 | 86.0 | 87.8 |
| HLE | 24.3 | 28.7 | 19.5 | 30.8 | 21.4 | 24.0 |
| LiveCodeBench v6 | 80.7 | 83.6 | 80.0 | 84.8 | 80.4 | 83.9 |
| HMMT Feb 25 | 92.0 | 94.8 | 88.7 | 92.9 | 90.7 | 93.8 |
| HMMT Nov 25 | 89.8 | 92.7 | 87.5 | 93.3 | 89.1 | 90.7 |
| HMMT Feb 26 | 84.3 | 87.9 | 77.2 | 85.3 | 83.6 | 84.3 |
| IMOAnswerBench | 79.9 | 80.9 | 74.5 | 84.0 | 78.9 | 80.8 |
| AIME26 | 92.6 | 93.3 | 89.2 | 95.1 | 92.7 | 94.1 |
* SWE-bench 系列:内部智能体框架(bash + 文件编辑工具);温度=1.0,top_p=0.95,200K 上下文窗口。我们修正了 SWE-bench Pro 公开集中的一些有问题任务,并在修正后的基准上评估所有基线。
* Terminal-Bench 2.0:Harbor/Terminus-2 框架;3 小时超时,32 CPU/48 GB RAM;温度=1.0,top_p=0.95,top_k=20,max_tokens=80K,256K 上下文;5 次运行的平均值。
* SkillsBench:通过 OpenCode 在 78 个任务上评估(自包含子集,排除依赖 API 的任务);5 次运行的平均值。
* NL2Repo:其他模型通过 Claude Code 评估(温度=1.0,top_p=0.95,max_turns=900)。
* QwenClawBench:一个真实用户分布的 Claw 智能体基准;温度=0.6,256K 上下文。
* QwenWebBench:一个内部前端代码生成基准;双语(EN/CN),7 个类别(网页设计、网页应用、游戏、SVG、数据可视化、动画和 3D);自动渲染 + 多模态评判(代码/视觉正确性);BT/Elo 评级系统。
* AIME 26:我们使用完整的 AIME 2026 (I & II),分数可能与 Qwen 3.5 备注中的不同。
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#vision-language
视觉语言
| Qwen3.5-27B | Qwen3.5-397B-A17B | Gemma4-31B | Claude 4.5 Opus | Qwen3.6-35B-A3B | Qwen3.6-27B | |
|---|---|---|---|---|---|---|
| STEM 与谜题 | ||||||
| MMMU | 82.3 | 85.0 | 80.4 | 80.7 | 81.7 | 82.9 |
| MMMU-Pro | 75.0 | 79.0 | 76.9 | 70.6 | 75.3 | 75.8 |
| MathVistamini | 87.8 | – | 79.3 | – | 86.4 | 87.4 |
| DynaMath | 87.7 | 86.3 | 79.5 | 79.7 | 82.8 | 85.6 |
| VlmsAreBlind | 96.9 | – | 87.2 | – | 96.6 | 97.0 |
| 通用 VQA | ||||||
| RealWorldQA | 83.7 | 83.9 | 72.3 | 77.0 | 85.3 | 84.1 |
| MMStar | 81.0 | 83.8 | 77.3 | 73.2 | 80.7 | 81.4 |
| MMBenchEN-DEV-v1.1 | 92.6 | – | 90.9 | – | 92.8 | 92.3 |
| SimpleVQA | 56.0 | 67.1 | 52.9 | 65.7 | 58.9 | 56.1 |
| 文档理解 | ||||||
| CharXivRQ | 79.5 | 80.8 | 67.9 | 68.5 | 78.0 | 78.4 |
| CC-OCR | 81.0 | 82.0 | 75.7 | 76.9 | 81.9 | 81.2 |
| OCRBench | 89.4 | – | 86.1 | – | 90.0 | 89.4 |
| 空间智能 | ||||||
| ERQA | 60.5 | 67.5 | 57.5 | 46.8 | 61.8 | 62.5 |
| CountBench | 97.8 | 97.2 | 96.1 | 90.6 | 96.1 | 97.8 |
| RefCOCOavg | 90.9 | 92.3 | – | – | 92.0 | 92.5 |
| EmbSpatialBench | 84.5 | – | – | – | 84.3 | 84.6 |
| RefSpatialBench | 67.7 | – | 4.7 | – | 64.3 | 70.0 |
| 视频理解 | ||||||
| VideoMME(w sub.) | 87.0 | 87.5 | – | 77.7 | 86.6 | 87.7 |
| VideoMMMU | 82.3 | 84.7 | 81.6 | 84.4 | 83.7 | 84.4 |
| MLVU | 85.9 | 86.7 | – | 81.7 | 86.2 | 86.6 |
| MVBench | 74.6 | 77.6 | – | 67.2 | 74.6 | 75.5 |
| 视觉智能体 | ||||||
| V* | 93.7 | 95.8 | – | 67.0 | 90.1 | 94.7 |
| AndroidWorld | 64.2 | – | – | – | – | 70.3 |
* 空单元格 (–) 表示分数尚未提供或不适用。
https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#quickstart
快速开始
为简化集成,我们建议通过 API 使用 Qwen3.6。以下是通过 OpenAI 兼容 API 使用 Qwen3.6 的指南。
https:/
相似文章
DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
基于 Qwen 3.6 27B 模型的社区微调去审查版本,提供高精度 GGUF 量化。
hesamation/Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF
一个 35B 参数的 Qwen3.6 模型,使用 Claude-Opus 风格的思维链蒸馏数据微调,并以 GGUF 量化格式发布,可在本地高效推理。
@Ex0byt: 各位,这是 Qwen3.6-27B-PRISM-PRO-DQ - 敬请享用!
发布了 Qwen3.6-27B-PRISM-PRO-DQ,这是 Qwen3.6-27B 的动态量化 GGUF 版本,去除了偏见/宣传内容,保留了原生 MTP 草稿头和视觉塔,支持无损推测解码以实现更快的推理。
mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF 刚刚发布!
Mudler 发布了 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled 模型的 APEX-MTP GGUF 量化版本,将多 token 预测头捆绑在一起,用于与 llama.cpp 的自推测解码。
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled
Jackrong 发布了 Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled,这是一个经过微调的 27B 参数模型,具有改进的推理能力和稳定性,并在 GitHub 上提供了使用 Unsloth 框架的全面训练指南和代码。