@spiritbuun: 我的第一个量化模型将在下周发布。我已经为此工作了一个多月。配方已经...

X AI KOLs Following 2026/06/02 18:43 模型

quantization model-optimization qat b27 open-source

摘要

宣布即将发布使用量化感知训练（QAT）的B27模型量化版本，号称迄今为止最智能的B27。

我的第一个量化模型将在下周发布。我已经为此工作了一个多月。配方已经锁定。QAT已完成。这不仅仅是量化。这是有史以来最智能的B27。 https://t.co/4t4a4GYHTS

查看原文

查看缓存全文

缓存时间: 2026/06/02 23:39

我的第一个量化模型将在下周发布。我已经为此努力了一个多月。方案已经确定。QAT已完成。这不只是量化——这是有史以来最聪明的B27。https://t.co/4t4a4GYHTS

相似文章

Reddit r/LocalLLaMA

作者分享了一个Qwen3.6 27B的量化方案，该方案使模型使用显著更少的思考令牌，同时仍然产生正确的答案，从而在数学基准测试中实现更快的推理。

X AI KOLs Following

社区成员发布了Qwen3.6-35B-A3B-PRISM-NVFP4——一款经过多轮、数据集校准、零损耗的NVFP4量化版Qwen模型。

X AI KOLs Timeline

TurboQuant 是 Qwopus3.6-27B-v2 模型的 GGUF 量化版本，经 GPQA 测试结果确认，并在 Hugging Face 上分享，感谢 Jackrong 和 KyleHessling。

X AI KOLs Following

Mirai Labs 发布了使用其新 Mirai 量化方法的 Qwen3.5 模型量化检查点，在 Apple 硬件上推理速度提升 40-60%，同时保持与全精度模型相当的性能。

X AI KOLs Timeline

SpectralQuant 是一种新的 KV 缓存量化技术，在 Mistral 7B 上实现了 5.95 倍压缩，仅带来 7.5% 的困惑度开销，显著优于 TurboQuant，且每个模型只需 15 秒校准。