gpu-performance

#gpu-performance

@populartourist: 在仓库上持续使用 Qwen3.6 27B NVFP4 后，很明显这个量化版本并不可靠，至少在编…

X AI KOLs Timeline ↗ · 昨天缓存

用户报告称 Qwen3.6 27B NVFP4 量化版本在编码方面不可靠，尽管吞吐量高但质量不稳定，并建议 Q4_K_M 可能更稳定。

0 人收藏 0 人点赞

#gpu-performance

X AI KOLs Timeline ↗ · 2026-05-12

Unsloth 发布了优化后的 Qwen3.6-27B MTP 模型 GGUF 版本，与前序量化版本相比，推理速度显著提升（在 RTX 5090 上最高可达 114 tok/s）。

0 人收藏 0 人点赞