mxfp4

标签

Cards List
#mxfp4

@charles_irl: 低精度浮点数很奇怪。我一直在推理/训练之外使用它们来建立直觉…

X AI KOLs Following · 2天前 缓存

一条推文介绍了微缩放/块量化格式(如NVFP4和MXFP4)的可视化工具,解释了这些低精度浮点数的工作原理以及它们在LLM推理中减少内存带宽需求的应用。

0 人收藏 0 人点赞
#mxfp4

@zcbenz: nvfp4与mxfp4不仅仅是块大小和缩放格式的不同选择,nvfp4还使用了额外的张量级缩放因子…

X AI KOLs Timeline · 6天前 缓存

对nvfp4和mxfp4格式的技术比较,强调nvfp4使用额外的张量级缩放因子来克服fp4的范围限制,从而可以在块级缩放因子上获得更高的精度。

0 人收藏 0 人点赞
#mxfp4

@dealignai: Qwen3.6-27b 和 35b 的 MXFP4 与 MXFP8 CRACK 版本现已推出,支持 MTP。尽享无审查的极速体验!35b mxfp4: https://huggingface…

X AI KOLs Timeline · 2026-05-24 缓存

DealignAI 发布了 Qwen3.6-27B 和 35B 模型的 CRACK-abliterated 以及 MXFP4/MXFP8 量化版本,保留了 MTP,可在 Apple Silicon 上实现更快的推测解码。

0 人收藏 0 人点赞
#mxfp4

分解LLM强化学习中MXFP4量化误差:可约简偏差、可恢复死区与不可约底限

arXiv cs.LG · 2026-05-21 缓存

本文证明了MXFP4量化误差可分解为三个加性分量——比例偏差、死区截断和网格噪声——并提出了针对性修正方法,能够在LLM强化学习后训练中,使Qwen2.5-3B的BF16精度恢复至0.7个百分点以内,Qwen3-30B-A3B-Base恢复至3.0个百分点以内。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈