gpu-performance

标签

Cards List
#gpu-performance

@populartourist: 在仓库上持续使用 Qwen3.6 27B NVFP4 后,很明显这个量化版本并不可靠,至少在编…

X AI KOLs Timeline · 昨天 缓存

用户报告称 Qwen3.6 27B NVFP4 量化版本在编码方面不可靠,尽管吞吐量高但质量不稳定,并建议 Q4_K_M 可能更稳定。

0 人收藏 0 人点赞
#gpu-performance

@TeksEdge: Unsloth 发布了目前我测试过的最快的 Qwen3.6-27B MTP GGUF。是时候升级了。与之前的 GGUF 相比,Q4/Q6 XL 版本的推理速度快了约 55%…

X AI KOLs Timeline · 2026-05-12

Unsloth 发布了优化后的 Qwen3.6-27B MTP 模型 GGUF 版本,与前序量化版本相比,推理速度显著提升(在 RTX 5090 上最高可达 114 tok/s)。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈