nvfp4-quantization

标签

Cards List
#nvfp4-quantization

@Ex0byt:激活、切片、拼接、微调数日,外加15小时屏息凝神的NVFP4校准/传播轮次……

X AI KOLs Following · 2026-04-22 缓存

社区成员发布了Qwen3.6-35B-A3B-PRISM-NVFP4——一款经过多轮、数据集校准、零损耗的NVFP4量化版Qwen模型。

0 人收藏 0 人点赞
#nvfp4-quantization

RedHatAI/Qwen3.6-35B-A3B-NVFP4

Hugging Face Models Trending · 2026-04-17 缓存

Red Hat AI 发布 NVFP4 量化的 35B MoE 版 Qwen3.6,在保持 96.28% GSM8K 精度的同时,通过 vLLM 实现 4-bit 推理。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈