structural-pruning

标签

Cards List
#structural-pruning

基于归因引导和覆盖最大化的结构化MoE压缩剪枝

arXiv cs.LG · 3天前 缓存

提出了一种针对MoE模型的结构化剪枝框架,通过基于归因的近似方法最大化通道分数覆盖,在结合4比特量化时实现50%或25%的剪枝,并在Qwen3-30B-A3B上将内存占用降低5.27倍。

0 人收藏 0 人点赞
#structural-pruning

用于大语言模型压缩的联合结构化剪枝与混合精度量化

arXiv cs.AI · 2026-06-09 缓存

一种新颖的端到端大语言模型压缩框架,联合优化结构化剪枝与混合精度量化,在超低位宽精度下,相比于现有最先进方法实现了显著的困惑度降低和加速效果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈