@songjunkr：SuperQwen3.6-35B-DFlash-MLX 完成。基准：在 100 条商业评测的真实样本上对比原版与微调版——GPQA Diamond、MMLU-Pro、IFEval、HumanEval+、MBPP+

X AI KOLs Timeline 2026/04/23 03:08 模型

mlx qwen fine-tuning uncensored benchmark

摘要

一款为 MLX 优化的 350 亿参数 Qwen 微调模型，在 GPQA Diamond、MMLU-Pro、IFEval、HumanEval+、MBPP+ 上全面提分，且无内容审查。

SuperQwen3.6-35B-DFlash-MLX 已完成。基准：在 100 条商业评测的真实样本上对比原版与微调版——GPQA Diamond、MMLU-Pro、IFEval、HumanEval+、MBPP+，当然无审查。MLX 版本将在数小时内发布。

查看原文

查看缓存全文

缓存时间: 2026/04/23 10:00

SuperQwen3.6-35B-DFlash-MLX 已就绪。
基准测试：在 100 道真实商用评测题上对比原版与微调版

当然，无审查。
MLX 版本将在数小时内发布。

相似文章

Reddit r/LocalLLaMA

用户评价了通过MLX为Apple Silicon优化的Qwen3.6-35B模型的量化微调版本，称赞其速度快、智能化程度高且没有安全免责声明。

Reddit r/LocalLLaMA

作者对小型本地 LLM 进行了基准测试，重点突出了 Qwen 3.6 35B A3B，其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。

X AI KOLs Following

Z-lab 发布适用于 Qwen3.6-35B-A3B 的 DFlash 模型微调/压缩技术，训练已全部完成，权重现已在 GitHub 和 HuggingFace 上提供。

X AI KOLs Following

一名用户在消费级硬件上使用 Unsloth 对 Qwen 3.6 35B 进行了基准测试，对比了 MTP、TriAttention 和 TurboQuant 优化效果，发现 TurboQuant 最为有效。

X AI KOLs Timeline

一个Qwen3.6-27B的社区微调在SWE-bench上提升了实际Bug修复能力，同时保持了质量，这与导致退化的合成蒸馏不同。