@spiritbuun: 我的第一个量化模型将在下周发布。我已经为此工作了一个多月。配方已经...
摘要
宣布即将发布使用量化感知训练(QAT)的B27模型量化版本,号称迄今为止最智能的B27。
我的第一个量化模型将在下周发布。我已经为此工作了一个多月。配方已经锁定。QAT已完成。这不仅仅是量化。这是有史以来最智能的B27。 https://t.co/4t4a4GYHTS
查看缓存全文
缓存时间: 2026/06/02 23:39
我的第一个量化模型将在下周发布。我已经为此努力了一个多月。方案已经确定。QAT已完成。这不只是量化——这是有史以来最聪明的B27。https://t.co/4t4a4GYHTS
相似文章
需要第二双眼睛,这个Qwen3.6 27B量化方案总是用更少的思考且正确
作者分享了一个Qwen3.6 27B的量化方案,该方案使模型使用显著更少的思考令牌,同时仍然产生正确的答案,从而在数学基准测试中实现更快的推理。
@Ex0byt:激活、切片、拼接、微调数日,外加15小时屏息凝神的NVFP4校准/传播轮次……
社区成员发布了Qwen3.6-35B-A3B-PRISM-NVFP4——一款经过多轮、数据集校准、零损耗的NVFP4量化版Qwen模型。
@coffeecup2020: TurboQuant - Qwopus3.6-27B-v2-TQ3_4S.gguf 通过gpqa测试确认,这非常棒。https://huggingface.co/YTan…
TurboQuant 是 Qwopus3.6-27B-v2 模型的 GGUF 量化版本,经 GPQA 测试结果确认,并在 Hugging Face 上分享,感谢 Jackrong 和 KyleHessling。
@norpadon: 我们发布了首个为 Qwen3.5 系列模型设计的量化检查点,这些模型与我们的推理引擎共同设计,以在 Apple 硬件上实现最佳性能。
Mirai Labs 发布了使用其新 Mirai 量化方法的 Qwen3.5 模型量化检查点,在 Apple 硬件上推理速度提升 40-60%,同时保持与全精度模型相当的性能。
@anirudhbv_ce: 介绍 SpectralQuant.. 来拯救您的 KV 缓存 :)
SpectralQuant 是一种新的 KV 缓存量化技术,在 Mistral 7B 上实现了 5.95 倍压缩,仅带来 7.5% 的困惑度开销,显著优于 TurboQuant,且每个模型只需 15 秒校准。