@songjunkr:SuperQwen3.6-35B-DFlash-MLX 完成。基准:在 100 条商业评测的真实样本上对比原版与微调版——GPQA Diamond、MMLU-Pro、IFEval、HumanEval+、MBPP+

X AI KOLs Timeline 模型

摘要

一款为 MLX 优化的 350 亿参数 Qwen 微调模型,在 GPQA Diamond、MMLU-Pro、IFEval、HumanEval+、MBPP+ 上全面提分,且无内容审查。

SuperQwen3.6-35B-DFlash-MLX 已完成。基准:在 100 条商业评测的真实样本上对比原版与微调版——GPQA Diamond、MMLU-Pro、IFEval、HumanEval+、MBPP+,当然无审查。MLX 版本将在数小时内发布。
查看原文
查看缓存全文

缓存时间: 2026/04/23 10:00

SuperQwen3.6-35B-DFlash-MLX 已就绪。
基准测试:在 100 道真实商用评测题上对比原版与微调版

  • GPQA Diamond
  • MMLU-Pro
  • IFEval
  • HumanEval+
  • MBPP+

当然,无审查。
MLX 版本将在数小时内发布。

相似文章

Qwen3.6-35B-A3B-Abliterated-Heretic-MLX-4bit

Reddit r/LocalLLaMA

用户评价了通过MLX为Apple Silicon优化的Qwen3.6-35B模型的量化微调版本,称赞其速度快、智能化程度高且没有安全免责声明。

Qwen 3.6 35B A3B 的热度绝非虚名!

Reddit r/LocalLLaMA

作者对小型本地 LLM 进行了基准测试,重点突出了 Qwen 3.6 35B A3B,其将学术代码与研究论文进行映射的能力优于 Gemma 4 和 Nemotron 3 Nano 等模型。