nvfp4-quantization

#nvfp4-quantization

@Ex0byt：激活、切片、拼接、微调数日，外加15小时屏息凝神的NVFP4校准/传播轮次……

X AI KOLs Following ↗ · 2026-04-22 缓存

社区成员发布了Qwen3.6-35B-A3B-PRISM-NVFP4——一款经过多轮、数据集校准、零损耗的NVFP4量化版Qwen模型。

0 人收藏 0 人点赞

#nvfp4-quantization

Hugging Face Models Trending ↗ · 2026-04-17 缓存

Red Hat AI 发布 NVFP4 量化的 35B MoE 版 Qwen3.6，在保持 96.28% GSM8K 精度的同时，通过 vLLM 实现 4-bit 推理。

0 人收藏 0 人点赞