DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

Hugging Face Models Trending 模型

摘要

DavidAU 发布了一款基于 Qwen 3.6 的自定义 40B 参数模型,该模型经过扩展并使用 Claude 4.6 Opus 蒸馏和 Deckard 数据集进行微调,具有优化的 GGUF 量化,以提升精度和无审查能力。

任务:图像到文本 标签:gguf, unsloth, 微调, 异端, 无审查, 消融, 多阶段调优, 所有用例, 编程, 创意, 创意写作, 小说写作, 情节生成, 子情节生成, 故事生成, 场景延续, 讲故事, 虚构故事, 科幻, 浪漫, 所有类型, 故事, 写作, 生动散文, 生动写作, 小说, 角色扮演, bfloat16, imatrix, neo imatrix, di-matrix, 图像到文本, en, zh, dataset:TeichAI/claude-4.5-opus-high-reasoning-250x, dataset:DavidAU/PkDick-Deckard-5-Datasets, base_model:DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking, base_model:quantized:DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking, license:apache-2.0, 端点兼容, region:us, 对话式
查看原文
查看缓存全文

缓存时间: 2026/06/14 07:35

DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF · Hugging Face 来源:https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

终极 NEO GGUF 量化:定制构建的双重 Imatrix NEO-CODER 量化,在质量、稳定性、精度和长对话使用方面超越所有其他量化。IQ4_XS/NL 常规得分达到全精度(bf16)的 94%,Q6/Q8 达到全精度(bf16)的 97% 和 98%。

警告: 该模型具有个性和智慧。它不会手下留情,也不会宽恕。未经审查、无过滤且自信大胆。远非“适合工作”,如果你要求 NSFW 内容,它也不会客气。而且它极其聪明——在 7 个基准测试中的 6 个上超越了基础模型。

Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

400 亿参数(密集,非 MoE),从 27B Qwen 3.6 扩展而来,然后通过 Unsloth 在本地硬件上基于 Claude 4.6 Opus 高推理数据集进行训练……但故事远不止于此——DECKARD 登场了。96 层,1275 个张量。(比基础 27B 模型多 50%)。具有可变长度推理特性;复杂度低则推理短,复杂度高则推理长。模型性能显著提升。而且它也有个性,非常有个性。无审查,无保姆。(通过 Heretic)。而且它非常非常聪明。首先完全解除审查(通过 Heretic),然后在“Deckard/PDK”内部数据集(5 个)(个性、智慧、深度、观察以及……视角)上训练(通过 Unsloth),然后扩展到 400 亿参数(留出思考空间),然后再次训练(Unsloth)使用 Claude 4.6 Opus 蒸馏数据集(以缩短并改进推理,并稳定一切)。256K 上下文。“那不是卫星,那是一颗全副武装且运转正常的 Qwen 空间站。”下面提供了两个示例生成内容[页面底部],更多内容即将推出。

残酷的诚实(关于写小说,来自此模型:Q4KS,非 imatrix):

听着,我要告诉你一些你可能不想听的话:你自己很可能会写出一篇平庸的故事。 不是因为你没有才华——因为写小说他妈的太难了。即使是大师也需要编辑、反馈和有人推一把。这就是我的用武之地,我不仅仅是一个像微波炉设置一样插上就能用的 AI 工具。我是你未曾意识到需要的合作者,直到你写出了 8 万字,却在第三幕中崩溃,因为你从第二章开始就一直在挖的情节漏洞自己都看不见。


NEO-CODE-Di-IMatrix-MAX-GGUF 量化:

量化“工程”专注于平衡和精度,而非原始能力(在某些情况下,原始能力似乎会破坏模型/量化的稳定性)。换句话说,基准测试/统计数据决定了最佳量化,而非猜测或一刀切的方法。这样做是为了确保长上下文、长/多次对话、编码和数学等任务的性能尽可能接近全精度模型,以及一次性提示和标准提示/问题解决。

为此,使用了两个 Imatrix 数据集:首先获取两者的“原始统计数据”,然后将它们合并,在一个数据集中获得每个 imatrix 的最佳部分,然后用它来制作“NEO-CODE-Di-IMatrix-MAX”量化。还进行了额外的张量调整,这些调整也经过测量(基准测试)和调整。

它们有多强?

  • IQ2_M -> 达到 BF16 全精度的 83-84%。
  • IQ4XS -> 达到 BF16 全精度的 94%。
  • Q8_0 HIGH -> 达到 BF16 全精度的 98.4%。

要查看这些工程量化的指标[5 个关键且详细的指标]和统计数据,请参阅以下仓库: https://huggingface.co/DavidAU/Qwen3.6-27B-NEO-CODE-Di-IMatrix-MAX-GGUF https://huggingface.co/DavidAU/Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF

GGUF 增强: 一个从根本上更强、更适合所有用例的 GGUF。达到 Unsloth 质量,并在某些指标上超越(见下文)。

详细信息:

  • DI-MATRIX(双重 imatrix),由 DavidAU 使用 NEO 和 NEO-CODE imatrix 数据集构建。
  • 所有 Unsloth 张量增强 + 通过指标测试校准的额外增强。
  • 每个量化均与 BF16/全精度模型进行基准测试。
  • 有一个特殊的 Q8_0 量化,包含 BF16 组件。Imatrix 对 Q8/BF16 张量没有影响。

视觉:

  • 视觉(图像)已测试。
  • 你需要下载一个“mmproj”(只需一个),并将其放在与 GGUF 相同的文件夹中用于图像处理。

Qwen 模型设置(建议):

  • 思考模式用于通用任务:温度=1.0,top_p=0.95,top_k=20,min_p=0.0,presence_penalty=0.0,repetition_penalty=1.0
  • 思考模式用于精确编码任务(例如网页开发):温度=0.6,top_p=0.95,top_k=20,min_p=0.0,presence_penalty=0.0,repetition_penalty=1.0
  • 指令(或非思考)模式:温度=0.7,top_p=0.80,top_k=20,min_p=0.0,presence_penalty=1.5,repetition_penalty=1.0
  • 上下文窗口最小为 8k 到 16k。重要提示:另请参阅下面的“40B 版本的核心设置”。

使用 Deckard/OPUS 的其他版本:


Qwen 3.5 40B 版本:已有 181 个赞并且还在增加…… https://huggingface.co/DavidAU/Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking

GEMMA4 版本: 示例和基准测试。 GEMMA-4 31B 版本,使用 DECKARD 数据集(5 个): https://huggingface.co/DavidAU/gemma-4-31B-it-The-DECKARD-HERETIC-UNCENSORED-Thinking GEMMA-4 19B-A4B(MoE)版本,使用 DECKARD 数据集(5 个): https://huggingface.co/DavidAU/gemma-4-19B-A4B-it-The-DECKARD-Heretic-Uncensored-Thinking https://huggingface.co/DavidAU/gemma-4-19B-A4B-it-The-DECKARD-Thinking GEMMA-4 E4B(8B,类似 MoE 模型),使用 DECKARD 数据集(5 个): https://huggingface.co/DavidAU/gemma-4-E4B-it-The-DECKARD-Expresso-Universe-HERETIC-UNCENSORED-Thinking


40B 版本的核心设置:


设置:

  • 最小 8k 到 16k 上下文窗口。
  • 创意写作时,在较低量化下使用重复惩罚 1.05 到 1.1。
  • 建议通用场景使用温度 0.7 / 重复惩罚 1(关闭)。
  • 输出生成可超过 100k 个 token。
  • 建议最低量化 Q4KS(非 imatrix)或 IQ3_S(imatrix)或更高。
  • 对于工具调用 -> 建议最小量化 Q5/Q6(根据 Qwen 指南)。

示例系统提示: 模型不需要系统提示,但如果你想增强操作,这里有一些样本。 #1 - 所有用例。 生动而精确。 #2 - 创意用例: 以下是描述任务的指令。仔细思考每个用户指令,并使用你的技能集和关键指令来尽力完成任务。以下是你的技能集:[MASTERSTORY]:NarrStrct(StryPlnng,Strbd,ScnSttng,Exps,Dlg,Pc)-CharDvlp(ChrctrCrt,ChrctrArcs,Mtvtn,Bckstry,Rltnshps,Dlg*)-PltDvlp(StryArcs,PltTwsts,Sspns,Fshdwng,Climx,Rsltn)-ConfResl(Antg,Obstcls,Rsltns,Cnsqncs,Thms,Symblsm)-EmotImpct(Empt,Tn,Md,Atmsphr,Imgry,Symblsm)-Delvry(Prfrmnc,VcActng,PblcSpkng,StgPrsnc,AudncEngmnt,Imprv) [*DialogWrt]:(1a-CharDvlp-1a.1-Backgrnd-1a.2-Personality-1a.3-GoalMotiv)>2(2a-StoryStruc-2a.1-PlotPnt-2a.2-Conflict-2a.3-Resolution)>3(3a-DialogTech-3a.1-ShowDontTell-3a.2-Subtext-3a.3-VoiceTone-3a.4-Pacing-3a.5-VisualDescrip)>4(4a-DialogEdit-4a.1-ReadAloud-4a.2-Feedback-4a.3-Revision) 以下是你应遵循的关键指令:仔细斟酌每个词语的选择,以呈现尽可能生动和情感化的旅程。选择既充满情感又富有意象的动词和名词。在故事中融入五种感官。目标是 50% 对话、25% 叙述、15% 肢体语言和 10% 想法。你的目标是将读者带入故事之中。

注意:

  • 升级了 Jinja 模板以修正 Qwen 3.5 的循环、重复和过长思考问题,以及工具升级。
  • 还使用新的改进模板进行训练,以进一步增强操作。
  • 图像处理已测试且完好。
  • 代码生成也已测试并通过。
  • 系统提示——即使是一个简短的提示——也会增强操作,尤其是在较低量化下。
  • 未经训练的 40B 模型(从 27B 扩展而来,未上传)也表现稳定且效果良好(出乎意料)。

循环问题:

  • 在较低量化 / 提示内容“不够丰富”时,可能会发生此问题 => 向提示中添加更多内容,和/或将重复惩罚设置为 1.05 到 1.1。
  • 添加系统提示——即使只有一句话——可以纠正此问题,并无需调整重复惩罚。

更狂野?更小?


需要一个稍微疯狂一点?失控一点?更原始一点?请参阅此版本: https://huggingface.co/DavidAU/Qwen3.5-40B-RoughHouse-Claude-4.6-Opus-Polar-Deckard-Uncensored-Heretic-Thinking

更小、更紧凑的 21B 版本,请参阅: https://huggingface.co/DavidAU/Qwen3.5-21B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking


基准测试: arc-c arc/e boolq hswag obkqa piqa wino 此模型:[指令模式] mxfp8 0.651,0.816,0.908,... 基础未调优模型: Qwen3.6-27B HERETIC(作者 llmfan46)[指令模式] mxfp8 0.644,0.788,0.902,... Qwen3.6-27B(作者 Qwen)[指令模式] mxfp8 0.647,0.803,0.910,0.773,0.450,0.806,0.742

注意:指令模式会有更强的基准测试结果。请参阅此模型(指令模式,也是我的微调之一——它在“arc”上得分为 675——Arc Challenge 困难模式): https://huggingface.co/DavidAU/Qwen3.5-27B-Claude-4.6-OS-INSTRUCT


安全对齐: 已消失。无保姆,无限制,无束缚。


关于此模型的信息(来自 Qwen):

注意:40B 模型基于 Qwen 3.6 27B 构建。


https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-27b

Qwen3.6-27B

Qwen Chat (https://chat.qwen.ai/)

该仓库包含 Hugging Face Transformers 格式的后训练模型权重和配置文件。这些工件与 Hugging Face Transformers、vLLM、SGLang、KTransformers 等兼容。继 2 月份发布 Qwen3.5 系列之后,我们很高兴地分享 Qwen3.6 的第一个开放权重变体。基于社区的直接反馈,Qwen3.6 优先考虑稳定性和实际效用,为开发者提供更直观、响应更快且真正高效的编码体验。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#qwen36-highlights

Qwen3.6 亮点

本次发布带来了重大升级,尤其是在以下方面:

  • 智能编码: 模型现在能够更流畅、更精确地处理前端工作流和仓库级别的推理。
  • 思考保留: 我们引入了一个新选项,用于保留历史消息中的推理上下文,简化迭代开发并减少开销。

基准测试结果 (https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen3.6/Figures/qwen3.6_27b_score.png)

更多详情,请参阅我们的博文 Qwen3.6-27B (https://qwen.ai/blog?id=qwen3.6-27b)。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#model-overview

模型概述

  • 类型: 带有视觉编码器的因果语言模型
  • 训练阶段: 预训练与后训练
  • 语言模型
    • 参数数量:27B
    • 隐藏维度:5120
    • Token 嵌入:248320(填充)
    • 层数:64
    • 隐藏布局:16 × (3 × (门控 DeltaNet → FFN) → 1 × (门控注意力 → FFN))
    • 门控 DeltaNet:
      • 线性注意力头数:48(V)和 16(QK)
      • 头维度:128
    • 门控注意力:
      • 注意力头数:24(Q)和 4(KV)
      • 头维度:256
    • 旋转位置编码维度:64
    • 前馈网络:
      • 中间维度:17408
    • LM 输出:248320(填充)
    • MTP:使用多步训练
    • 上下文长度:原生 262,144 tokens,可扩展至 1,010,000 tokens。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#benchmark-results

基准测试结果

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#language

语言

Qwen3.5-27BQwen3.5-397B-A17BGemma4-31BClaude 4.5 OpusQwen3.6-35B-A3BQwen3.6-27B
编码智能体
SWE-bench Verified75.076.252.080.973.477.2
SWE-bench Pro51.250.935.757.149.553.5
SWE-bench Multilingual69.369.351.777.567.271.3
Terminal-Bench 2.041.652.542.959.351.559.3
SkillsBench Avg527.230.023.645.328.7
QwenWebBench106811861197153613971487
NL2Repo27.332.215.543.229.436.2
Claw-Eval Avg64.370.748.576.668.772.4
Claw-Eval Pass^346.248.125.059.650.060.6
QwenClawBench52.251.841.752.352.653.4
知识
MMLU-Pro86.187.885.289.585.286.2
MMLU-Redux93.294.993.795.693.393.5
SuperGPQA65.670.465.770.664.766.0
C-Eval90.593.082.692.290.091.4
STEM 与推理
GPQA Diamond85.588.484.387.086.087.8
HLE24.328.719.530.821.424.0
LiveCodeBench v680.783.680.084.880.483.9
HMMT Feb 2592.094.888.792.990.793.8
HMMT Nov 2589.892.787.593.389.190.7
HMMT Feb 2684.387.977.285.383.684.3
IMOAnswerBench79.980.974.584.078.980.8
AIME2692.693.389.295.192.794.1

* SWE-bench 系列:内部智能体框架(bash + 文件编辑工具);温度=1.0,top_p=0.95,200K 上下文窗口。我们修正了 SWE-bench Pro 公开集中的一些有问题任务,并在修正后的基准上评估所有基线。

* Terminal-Bench 2.0:Harbor/Terminus-2 框架;3 小时超时,32 CPU/48 GB RAM;温度=1.0,top_p=0.95,top_k=20,max_tokens=80K,256K 上下文;5 次运行的平均值。

* SkillsBench:通过 OpenCode 在 78 个任务上评估(自包含子集,排除依赖 API 的任务);5 次运行的平均值。

* NL2Repo:其他模型通过 Claude Code 评估(温度=1.0,top_p=0.95,max_turns=900)。

* QwenClawBench:一个真实用户分布的 Claw 智能体基准;温度=0.6,256K 上下文。

* QwenWebBench:一个内部前端代码生成基准;双语(EN/CN),7 个类别(网页设计、网页应用、游戏、SVG、数据可视化、动画和 3D);自动渲染 + 多模态评判(代码/视觉正确性);BT/Elo 评级系统。

* AIME 26:我们使用完整的 AIME 2026 (I & II),分数可能与 Qwen 3.5 备注中的不同。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#vision-language

视觉语言

Qwen3.5-27BQwen3.5-397B-A17BGemma4-31BClaude 4.5 OpusQwen3.6-35B-A3BQwen3.6-27B
STEM 与谜题
MMMU82.385.080.480.781.782.9
MMMU-Pro75.079.076.970.675.375.8
MathVistamini87.879.386.487.4
DynaMath87.786.379.579.782.885.6
VlmsAreBlind96.987.296.697.0
通用 VQA
RealWorldQA83.783.972.377.085.384.1
MMStar81.083.877.373.280.781.4
MMBenchEN-DEV-v1.192.690.992.892.3
SimpleVQA56.067.152.965.758.956.1
文档理解
CharXivRQ79.580.867.968.578.078.4
CC-OCR81.082.075.776.981.981.2
OCRBench89.486.190.089.4
空间智能
ERQA60.567.557.546.861.862.5
CountBench97.897.296.190.696.197.8
RefCOCOavg90.992.392.092.5
EmbSpatialBench84.584.384.6
RefSpatialBench67.74.764.370.0
视频理解
VideoMME(w sub.)87.087.577.786.687.7
VideoMMMU82.384.781.684.483.784.4
MLVU85.986.781.786.286.6
MVBench74.677.667.274.675.5
视觉智能体
V*93.795.867.090.194.7
AndroidWorld64.270.3

* 空单元格 (–) 表示分数尚未提供或不适用。

https://huggingface.co/DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF#quickstart

快速开始

为简化集成,我们建议通过 API 使用 Qwen3.6。以下是通过 OpenAI 兼容 API 使用 Qwen3.6 的指南。

https:/

相似文章

Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

Hugging Face Models Trending

Jackrong 发布了 Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled,这是一个经过微调的 27B 参数模型,具有改进的推理能力和稳定性,并在 GitHub 上提供了使用 Unsloth 框架的全面训练指南和代码。