activation-outliers

标签

Cards List
#activation-outliers

Dominant-Layer ZO:单一层主导LLMs的零阶微调

arXiv cs.LG · 2026-06-05 缓存

本文揭示了LLM的零阶微调主要由单个解码层主导,该层可通过激活异常值识别,并且仅微调该层即可达到或超越全模型微调的效果,同时带来高达4.52倍的加速。

0 人收藏 0 人点赞
#activation-outliers

基于平坦度的理论最优量化

arXiv cs.LG · 2026-05-20 缓存

介绍了平坦度度量与双向对角量化(BDQ)用于大型语言模型的训练后量化,实现了接近无损的4比特权重和激活量化,并在极低比特设置下取得了显著改进。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈