@zcbenz: nvfp4与mxfp4不仅仅是块大小和缩放格式的不同选择,nvfp4还使用了额外的张量级缩放因子…

X AI KOLs Timeline 新闻

摘要

对nvfp4和mxfp4格式的技术比较,强调nvfp4使用额外的张量级缩放因子来克服fp4的范围限制,从而可以在块级缩放因子上获得更高的精度。

nvfp4与mxfp4不仅仅是块大小和缩放格式的不同选择,nvfp4还使用额外的张量级缩放因子来克服fp4的范围限制,从而可以在块级缩放因子上使用更高的精度。https://t.co/9d1hvNBWhO
查看原文
查看缓存全文

缓存时间: 2026/06/17 16:02

nvfp4与mxfp4的区别不仅在于块大小和缩放格式的选择,nvfp4还使用了额外的张量级缩放因子来克服fp4的范围限制,从而可以为块级缩放因子使用更高的精度。https://t.co/9d1hvNBWhO

相似文章

@witcheer:大家都说NVFP4让黑伟德显卡“更快”。我在我的5090上对Qwen3.6-27B进行了三种方式的基准测试:>NVFP4 >普通Q4_K…

X AI KOLs Timeline

在RTX 5090上对Qwen3.6-27B进行的NVFP4基准测试显示,与同等比特的Q4_K_M相比,预填速度提升32-42%,与Q6_K相比提升52-68%,但解码速度提升有限(相比Q4提升+9%),因为解码受内存带宽限制。与Q6相比,质量损失极小(平均-0.8),使得NVFP4成为本地推理的不错选择。