fp4

#fp4

重新思考LLM FP4预训练中的收缩偏差：几何起源、系统性影响与UFP4方案

Hugging Face Daily Papers ↗ · 6天前缓存

本文识别了LLM预训练中非均匀FP4量化格式的一个根本限制（收缩偏差），并提出了UFP4，一种优于现有基于E2M1方法的统一4位训练方案。

0 人收藏 0 人点赞

#fp4

X AI KOLs Timeline ↗ · 2026-05-24 缓存

将 Qwen 3.6 35b a3b 模型转换为 ROCmfp4 格式，利用 MTP 优势提升 AMD 硬件上的性能。

0 人收藏 0 人点赞

#fp4

X AI KOLs Following ↗ · 2026-05-18 缓存

来自 Modal 的 LLM Engineer's Almanac，提供了一个互动探索器，用于理解 bf16 和 fp4 等低精度浮点数格式。

0 人收藏 0 人点赞