保范Abliteration应用于Qwen3.6-35B-A3B：0%拒绝率，基准测试性能完整，开源数据集

Reddit r/LocalLLaMA 2026/06/30 09:54 论文

norm-preserving abliteration refusal benchmarks open-source dataset qwen

摘要

对Qwen3.6-35B-A3B应用保范Abliteration技术，实现0%拒绝率，基准测试性能保持不变，并发布了开源数据集。

暂无内容

查看原文

相似文章

Hugging Face Models Trending

OBLITERATUS 发布了经过修改的 27B Qwen3.6 检查点，通过源绑定消融技术消除了拒绝行为，保留了能力并支持无审查的本地使用。公开基准测试显示高非拒绝率，同时保持了 MMLU-Pro 分数。

Reddit r/LocalLLaMA

本文介绍了Abliterlitics，一个用于分析消融技术的开源工具包，并比较了Qwen3.6-27B的五种消融变体，使用了85 GPU小时的基准测试、安全评估和权重取证。Heretic和Huihui在保持能力方面表现最佳，而所有变体都实现了近乎完全的安全移除。

Reddit r/LocalLLaMA

用户发布了Apostate，这是Qwen 3.6 27B的去安全对齐版本，将安全对齐拒绝率从92%降低到7.6%，同时能力损失极小（KL 0.120）。

X AI KOLs Timeline

发布了 Qwen3.6-27B-PRISM-PRO-DQ，这是 Qwen3.6-27B 的动态量化 GGUF 版本，去除了偏见/宣传内容，保留了原生 MTP 草稿头和视觉塔，支持无损推测解码以实现更快的推理。

Reddit r/LocalLLaMA

一位社区研究员分享了为Qwen3.6-27B定制的量化方案，通过将高异常值子层保留为BF16格式，生成体积更小的30GB Q8 GGUF模型，在KLD和top-p指标上优于Unsloth的33GB Q8_K_XL变体。