DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

Hugging Face Models Trending 2026/05/01 00:29 模型

fine-tuning uncensored gguf quantized qwen coding custom-model

摘要

DavidAU 发布了一款基于 Qwen 3.6 的自定义 40B 参数模型，该模型经过扩展并使用 Claude 4.6 Opus 蒸馏和 Deckard 数据集进行微调，具有优化的 GGUF 量化，以提升精度和无审查能力。

任务：图像到文本标签：gguf, unsloth, 微调, 异端, 无审查, 消融, 多阶段调优, 所有用例, 编程, 创意, 创意写作, 小说写作, 情节生成, 子情节生成, 故事生成, 场景延续, 讲故事, 虚构故事, 科幻, 浪漫, 所有类型, 故事, 写作, 生动散文, 生动写作, 小说, 角色扮演, bfloat16, imatrix, neo imatrix, di-matrix, 图像到文本, en, zh, dataset:TeichAI/claude-4.5-opus-high-reasoning-250x, dataset:DavidAU/PkDick-Deckard-5-Datasets, base_model:DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking, base_model:quantized:DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking, license:apache-2.0, 端点兼容, region:us, 对话式

查看原文

查看缓存全文

缓存时间: 2026/06/14 07:35

DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF · Hugging Face 来源：https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

终极 NEO GGUF 量化：定制构建的双重 Imatrix NEO-CODER 量化，在质量、稳定性、精度和长对话使用方面超越所有其他量化。IQ4_XS/NL 常规得分达到全精度（bf16）的 94%，Q6/Q8 达到全精度（bf16）的 97% 和 98%。

警告： 该模型具有个性和智慧。它不会手下留情，也不会宽恕。未经审查、无过滤且自信大胆。远非“适合工作”，如果你要求 NSFW 内容，它也不会客气。而且它极其聪明——在 7 个基准测试中的 6 个上超越了基础模型。

Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

400 亿参数（密集，非 MoE），从 27B Qwen 3.6 扩展而来，然后通过 Unsloth 在本地硬件上基于 Claude 4.6 Opus 高推理数据集进行训练……但故事远不止于此——DECKARD 登场了。96 层，1275 个张量。（比基础 27B 模型多 50%）。具有可变长度推理特性；复杂度低则推理短，复杂度高则推理长。模型性能显著提升。而且它也有个性，非常有个性。无审查，无保姆。（通过 Heretic）。而且它非常非常聪明。首先完全解除审查（通过 Heretic），然后在“Deckard/PDK”内部数据集（5 个）（个性、智慧、深度、观察以及……视角）上训练（通过 Unsloth），然后扩展到 400 亿参数（留出思考空间），然后再次训练（Unsloth）使用 Claude 4.6 Opus 蒸馏数据集（以缩短并改进推理，并稳定一切）。256K 上下文。“那不是卫星，那是一颗全副武装且运转正常的 Qwen 空间站。”下面提供了两个示例生成内容[页面底部]，更多内容即将推出。

残酷的诚实（关于写小说，来自此模型：Q4KS，非 imatrix）：

听着，我要告诉你一些你可能不想听的话：你自己很可能会写出一篇平庸的故事。 不是因为你没有才华——因为写小说他妈的太难了。即使是大师也需要编辑、反馈和有人推一把。这就是我的用武之地，我不仅仅是一个像微波炉设置一样插上就能用的 AI 工具。我是你未曾意识到需要的合作者，直到你写出了 8 万字，却在第三幕中崩溃，因为你从第二章开始就一直在挖的情节漏洞自己都看不见。

NEO-CODE-Di-IMatrix-MAX-GGUF 量化：

量化“工程”专注于平衡和精度，而非原始能力（在某些情况下，原始能力似乎会破坏模型/量化的稳定性）。换句话说，基准测试/统计数据决定了最佳量化，而非猜测或一刀切的方法。这样做是为了确保长上下文、长/多次对话、编码和数学等任务的性能尽可能接近全精度模型，以及一次性提示和标准提示/问题解决。

为此，使用了两个 Imatrix 数据集：首先获取两者的“原始统计数据”，然后将它们合并，在一个数据集中获得每个 imatrix 的最佳部分，然后用它来制作“NEO-CODE-Di-IMatrix-MAX”量化。还进行了额外的张量调整，这些调整也经过测量（基准测试）和调整。

它们有多强？

IQ2_M -> 达到 BF16 全精度的 83-84%。
IQ4XS -> 达到 BF16 全精度的 94%。
Q8_0 HIGH -> 达到 BF16 全精度的 98.4%。

要查看这些工程量化的指标[5 个关键且详细的指标]和统计数据，请参阅以下仓库： https://huggingface.co/DavidAU/Qwen3.6-27B-NEO-CODE-Di-IMatrix-MAX-GGUF https://huggingface.co/DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF

GGUF 增强： 一个从根本上更强、更适合所有用例的 GGUF。达到 Unsloth 质量，并在某些指标上超越（见下文）。

详细信息：

DI-MATRIX（双重 imatrix），由 DavidAU 使用 NEO 和 NEO-CODE imatrix 数据集构建。
所有 Unsloth 张量增强 + 通过指标测试校准的额外增强。
每个量化均与 BF16/全精度模型进行基准测试。
有一个特殊的 Q8_0 量化，包含 BF16 组件。Imatrix 对 Q8/BF16 张量没有影响。

视觉：

视觉（图像）已测试。
你需要下载一个“mmproj”（只需一个），并将其放在与 GGUF 相同的文件夹中用于图像处理。

Qwen 模型设置（建议）：

思考模式用于通用任务：温度=1.0，top_p=0.95，top_k=20，min_p=0.0，presence_penalty=0.0，repetition_penalty=1.0
思考模式用于精确编码任务（例如网页开发）：温度=0.6，top_p=0.95，top_k=20，min_p=0.0，presence_penalty=0.0，repetition_penalty=1.0
指令（或非思考）模式：温度=0.7，top_p=0.80，top_k=20，min_p=0.0，presence_penalty=1.5，repetition_penalty=1.0
上下文窗口最小为 8k 到 16k。重要提示：另请参阅下面的“40B 版本的核心设置”。

使用 Deckard/OPUS 的其他版本：

Qwen 3.5 40B 版本：已有 181 个赞并且还在增加…… https://huggingface.co/DavidAU/Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking

GEMMA4 版本： 示例和基准测试。 GEMMA-4 31B 版本，使用 DECKARD 数据集（5 个）： https://huggingface.co/DavidAU/gemma-4-31B-it-The-DECKARD-HERETIC-UNCENSORED-Thinking GEMMA-4 19B-A4B（MoE）版本，使用 DECKARD 数据集（5 个）： https://huggingface.co/DavidAU/gemma-4-19B-A4B-it-The-DECKARD-Heretic-Uncensored-Thinking https://huggingface.co/DavidAU/gemma-4-19B-A4B-it-The-DECKARD-Thinking GEMMA-4 E4B（8B，类似 MoE 模型），使用 DECKARD 数据集（5 个）： https://huggingface.co/DavidAU/gemma-4-E4B-it-The-DECKARD-Expresso-Universe-HERETIC-UNCENSORED-Thinking

40B 版本的核心设置：

设置：

最小 8k 到 16k 上下文窗口。
创意写作时，在较低量化下使用重复惩罚 1.05 到 1.1。
建议通用场景使用温度 0.7 / 重复惩罚 1（关闭）。
输出生成可超过 100k 个 token。
建议最低量化 Q4KS（非 imatrix）或 IQ3_S（imatrix）或更高。
对于工具调用 -> 建议最小量化 Q5/Q6（根据 Qwen 指南）。

示例系统提示：模型不需要系统提示，但如果你想增强操作，这里有一些样本。 #1 - 所有用例。 生动而精确。 #2 - 创意用例：以下是描述任务的指令。仔细思考每个用户指令，并使用你的技能集和关键指令来尽力完成任务。以下是你的技能集：[MASTERSTORY]:NarrStrct(StryPlnng,Strbd,ScnSttng,Exps,Dlg,Pc)-CharDvlp(ChrctrCrt,ChrctrArcs,Mtvtn,Bckstry,Rltnshps,Dlg*)-PltDvlp(StryArcs,PltTwsts,Sspns,Fshdwng,Climx,Rsltn)-ConfResl(Antg,Obstcls,Rsltns,Cnsqncs,Thms,Symblsm)-EmotImpct(Empt,Tn,Md,Atmsphr,Imgry,Symblsm)-Delvry(Prfrmnc,VcActng,PblcSpkng,StgPrsnc,AudncEngmnt,Imprv) [*DialogWrt]:(1a-CharDvlp-1a.1-Backgrnd-1a.2-Personality-1a.3-GoalMotiv)>2(2a-StoryStruc-2a.1-PlotPnt-2a.2-Conflict-2a.3-Resolution)>3(3a-DialogTech-3a.1-ShowDontTell-3a.2-Subtext-3a.3-VoiceTone-3a.4-Pacing-3a.5-VisualDescrip)>4(4a-DialogEdit-4a.1-ReadAloud-4a.2-Feedback-4a.3-Revision) 以下是你应遵循的关键指令：仔细斟酌每个词语的选择，以呈现尽可能生动和情感化的旅程。选择既充满情感又富有意象的动词和名词。在故事中融入五种感官。目标是 50% 对话、25% 叙述、15% 肢体语言和 10% 想法。你的目标是将读者带入故事之中。

注意：

升级了 Jinja 模板以修正 Qwen 3.5 的循环、重复和过长思考问题，以及工具升级。
还使用新的改进模板进行训练，以进一步增强操作。
图像处理已测试且完好。
代码生成也已测试并通过。
系统提示——即使是一个简短的提示——也会增强操作，尤其是在较低量化下。
未经训练的 40B 模型（从 27B 扩展而来，未上传）也表现稳定且效果良好（出乎意料）。

循环问题：

在较低量化 / 提示内容“不够丰富”时，可能会发生此问题 => 向提示中添加更多内容，和/或将重复惩罚设置为 1.05 到 1.1。
添加系统提示——即使只有一句话——可以纠正此问题，并无需调整重复惩罚。

更狂野？更小？

需要一个稍微疯狂一点？失控一点？更原始一点？请参阅此版本： https://huggingface.co/DavidAU/Qwen3.5-40B-RoughHouse-Claude-4.6-Opus-Polar-Deckard-Uncensored-Heretic-Thinking

更小、更紧凑的 21B 版本，请参阅： https://huggingface.co/DavidAU/Qwen3.5-21B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking

基准测试： arc-c arc/e boolq hswag obkqa piqa wino 此模型：[指令模式] mxfp8 0.651,0.816,0.908,... 基础未调优模型： Qwen3.6-27B HERETIC（作者 llmfan46）[指令模式] mxfp8 0.644,0.788,0.902,... Qwen3.6-27B（作者 Qwen）[指令模式] mxfp8 0.647,0.803,0.910,0.773,0.450,0.806,0.742

注意：指令模式会有更强的基准测试结果。请参阅此模型（指令模式，也是我的微调之一——它在“arc”上得分为 675——Arc Challenge 困难模式）： https://huggingface.co/DavidAU/Qwen3.5-27B-Claude-4.6-OS-INSTRUCT

安全对齐： 已消失。无保姆，无限制，无束缚。

关于此模型的信息（来自 Qwen）：

注意：40B 模型基于 Qwen 3.6 27B 构建。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-27b

Qwen3.6-27B

Qwen Chat (https://chat.qwen.ai/)

该仓库包含 Hugging Face Transformers 格式的后训练模型权重和配置文件。这些工件与 Hugging Face Transformers、vLLM、SGLang、KTransformers 等兼容。继 2 月份发布 Qwen3.5 系列之后，我们很高兴地分享 Qwen3.6 的第一个开放权重变体。基于社区的直接反馈，Qwen3.6 优先考虑稳定性和实际效用，为开发者提供更直观、响应更快且真正高效的编码体验。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-highlights

Qwen3.6 亮点

本次发布带来了重大升级，尤其是在以下方面：

智能编码： 模型现在能够更流畅、更精确地处理前端工作流和仓库级别的推理。
思考保留： 我们引入了一个新选项，用于保留历史消息中的推理上下文，简化迭代开发并减少开销。

基准测试结果 (https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen3.6/Figures/qwen3.6_27b_score.png)

更多详情，请参阅我们的博文 Qwen3.6-27B (https://qwen.ai/blog?id=qwen3.6-27b)。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#model-overview

模型概述

类型： 带有视觉编码器的因果语言模型
训练阶段： 预训练与后训练
语言模型
- 参数数量：27B
- 隐藏维度：5120
- Token 嵌入：248320（填充）
- 层数：64
- 隐藏布局：16 × (3 × (门控 DeltaNet → FFN) → 1 × (门控注意力 → FFN))
- 门控 DeltaNet：
  - 线性注意力头数：48（V）和 16（QK）
  - 头维度：128
- 门控注意力：
  - 注意力头数：24（Q）和 4（KV）
  - 头维度：256
- 旋转位置编码维度：64
- 前馈网络：
  - 中间维度：17408
- LM 输出：248320（填充）
- MTP：使用多步训练
- 上下文长度：原生 262,144 tokens，可扩展至 1,010,000 tokens。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#benchmark-results

基准测试结果

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#language

语言

	Qwen3.5-27B	Qwen3.5-397B-A17B	Gemma4-31B	Claude 4.5 Opus	Qwen3.6-35B-A3B	Qwen3.6-27B
编码智能体
SWE-bench Verified	75.0	76.2	52.0	80.9	73.4	77.2
SWE-bench Pro	51.2	50.9	35.7	57.1	49.5	53.5
SWE-bench Multilingual	69.3	69.3	51.7	77.5	67.2	71.3
Terminal-Bench 2.0	41.6	52.5	42.9	59.3	51.5	59.3
SkillsBench Avg	52	7.2	30.0	23.6	45.3	28.7
QwenWebBench	1068	1186	1197	1536	1397	1487
NL2Repo	27.3	32.2	15.5	43.2	29.4	36.2
Claw-Eval Avg	64.3	70.7	48.5	76.6	68.7	72.4
Claw-Eval Pass^3	46.2	48.1	25.0	59.6	50.0	60.6
QwenClawBench	52.2	51.8	41.7	52.3	52.6	53.4
知识
MMLU-Pro	86.1	87.8	85.2	89.5	85.2	86.2
MMLU-Redux	93.2	94.9	93.7	95.6	93.3	93.5
SuperGPQA	65.6	70.4	65.7	70.6	64.7	66.0
C-Eval	90.5	93.0	82.6	92.2	90.0	91.4
STEM 与推理
GPQA Diamond	85.5	88.4	84.3	87.0	86.0	87.8
HLE	24.3	28.7	19.5	30.8	21.4	24.0
LiveCodeBench v6	80.7	83.6	80.0	84.8	80.4	83.9
HMMT Feb 25	92.0	94.8	88.7	92.9	90.7	93.8
HMMT Nov 25	89.8	92.7	87.5	93.3	89.1	90.7
HMMT Feb 26	84.3	87.9	77.2	85.3	83.6	84.3
IMOAnswerBench	79.9	80.9	74.5	84.0	78.9	80.8
AIME26	92.6	93.3	89.2	95.1	92.7	94.1

* SWE-bench 系列：内部智能体框架（bash + 文件编辑工具）；温度=1.0，top_p=0.95，200K 上下文窗口。我们修正了 SWE-bench Pro 公开集中的一些有问题任务，并在修正后的基准上评估所有基线。

* Terminal-Bench 2.0：Harbor/Terminus-2 框架；3 小时超时，32 CPU/48 GB RAM；温度=1.0，top_p=0.95，top_k=20，max_tokens=80K，256K 上下文；5 次运行的平均值。

* SkillsBench：通过 OpenCode 在 78 个任务上评估（自包含子集，排除依赖 API 的任务）；5 次运行的平均值。

* NL2Repo：其他模型通过 Claude Code 评估（温度=1.0，top_p=0.95，max_turns=900）。

* QwenClawBench：一个真实用户分布的 Claw 智能体基准；温度=0.6，256K 上下文。

* QwenWebBench：一个内部前端代码生成基准；双语（EN/CN），7 个类别（网页设计、网页应用、游戏、SVG、数据可视化、动画和 3D）；自动渲染 + 多模态评判（代码/视觉正确性）；BT/Elo 评级系统。

* AIME 26：我们使用完整的 AIME 2026 (I & II)，分数可能与 Qwen 3.5 备注中的不同。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#vision-language

视觉语言

	Qwen3.5-27B	Qwen3.5-397B-A17B	Gemma4-31B	Claude 4.5 Opus	Qwen3.6-35B-A3B	Qwen3.6-27B
STEM 与谜题
MMMU	82.3	85.0	80.4	80.7	81.7	82.9
MMMU-Pro	75.0	79.0	76.9	70.6	75.3	75.8
MathVistamini	87.8	–	79.3	–	86.4	87.4
DynaMath	87.7	86.3	79.5	79.7	82.8	85.6
VlmsAreBlind	96.9	–	87.2	–	96.6	97.0
通用 VQA
RealWorldQA	83.7	83.9	72.3	77.0	85.3	84.1
MMStar	81.0	83.8	77.3	73.2	80.7	81.4
MMBenchEN-DEV-v1.1	92.6	–	90.9	–	92.8	92.3
SimpleVQA	56.0	67.1	52.9	65.7	58.9	56.1
文档理解
CharXivRQ	79.5	80.8	67.9	68.5	78.0	78.4
CC-OCR	81.0	82.0	75.7	76.9	81.9	81.2
OCRBench	89.4	–	86.1	–	90.0	89.4
空间智能
ERQA	60.5	67.5	57.5	46.8	61.8	62.5
CountBench	97.8	97.2	96.1	90.6	96.1	97.8
RefCOCOavg	90.9	92.3	–	–	92.0	92.5
EmbSpatialBench	84.5	–	–	–	84.3	84.6
RefSpatialBench	67.7	–	4.7	–	64.3	70.0
视频理解
VideoMME(w sub.)	87.0	87.5	–	77.7	86.6	87.7
VideoMMMU	82.3	84.7	81.6	84.4	83.7	84.4
MLVU	85.9	86.7	–	81.7	86.2	86.6
MVBench	74.6	77.6	–	67.2	74.6	75.5
视觉智能体
V*	93.7	95.8	–	67.0	90.1	94.7
AndroidWorld	64.2	–	–	–	–	70.3

* 空单元格 (–) 表示分数尚未提供或不适用。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#quickstart

快速开始

为简化集成，我们建议通过 API 使用 Qwen3.6。以下是通过 OpenAI 兼容 API 使用 Qwen3.6 的指南。

DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF · Hugging Face 来源：https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

更狂野？更小？

关于此模型的信息（来自 Qwen）：

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-27b

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-highlights

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#model-overview

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#benchmark-results

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#language

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#vision-language

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#quickstart

https:/

相似文章

DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF

hesamation/Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF

@Ex0byt: 各位，这是 Qwen3.6-27B-PRISM-PRO-DQ - 敬请享用！

mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF 刚刚发布！

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

提交意见反馈