fp4

标签

Cards List
#fp4

重新思考LLM FP4预训练中的收缩偏差:几何起源、系统性影响与UFP4方案

Hugging Face Daily Papers · 6天前 缓存

本文识别了LLM预训练中非均匀FP4量化格式的一个根本限制(收缩偏差),并提出了UFP4,一种优于现有基于E2M1方法的统一4位训练方案。

0 人收藏 0 人点赞
#fp4

@Italianclownz: 已将 Qwen 3.6 35b a3b 转换为 ROCmfp4,运行飞快。使用了 mtp 版本,因为此 ROCmfp4 也可以融合 MTP 的优势…

X AI KOLs Timeline · 2026-05-24 缓存

将 Qwen 3.6 35b a3b 模型转换为 ROCmfp4 格式,利用 MTP 优势提升 AMD 硬件上的性能。

0 人收藏 0 人点赞
#fp4

@charles_irl: @modal LLMEng Almanac 的另一页:低精度浮点数(从 bf16 到 fp4)探索器 https://modal.com/ll…

X AI KOLs Following · 2026-05-18 缓存

来自 Modal 的 LLM Engineer's Almanac,提供了一个互动探索器,用于理解 bf16 和 fp4 等低精度浮点数格式。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈