Squeeze-Release: 迭代剪枝与精确结构最小化

Hugging Face Daily Papers 2026/06/12 00:00 论文

摘要

本文介绍了Squeeze-Release，一种实现精确结构最小化的迭代剪枝方法。

非结构化剪枝会产生稀疏权重张量，但标准实现保持张量形状不变，因此部署后的模型并不比剪枝前更小。我们提出了一种精确的结构重写方法，称为最小化，它可以将掩码网络转换为一个更小的密集网络，且其前向函数在浮点数舍入误差范围内保持一致。Squeeze-Release循环迭代进行剪枝和最小化，其中间有一个释放步骤，将压缩张量中精确为零的位置重新启用为小的校准噪声，从而将原本浪费的容量重新转化为可训练参数。连续的循环利用该容量来发现单次剪枝无法触及的结构冗余。此外，我们引入了CompensatedLayerNorm，这是一种保持功能的LayerNorm替代方案，可将最小化扩展到具有LayerNorm的残差流中的通道缩减。在保持相当精度的情况下，Squeeze-Release将全连接模型网络的可部署网络缩小了39倍，在现代CNN（ConvNeXt-Tiny）上缩小了14.8倍。此外，我们证明了该重写方法可以扩展到Transformer架构。

查看原文

查看缓存全文

缓存时间: 2026/06/15 16:59

论文页面 - Squeeze-Release: 基于精确结构最小化的迭代剪枝

来源：https://huggingface.co/papers/2606.14346

在你的代理中获取此论文：

hf papers read 2606\.14346

没有最新的CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用该论文的模型 0

没有模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2606.14346，以便从此页面链接。

引用该论文的数据集 0

没有数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2606.14346，以便从此页面链接。

引用该论文的 Spaces 0

没有 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2606.14346，以便从此页面链接。

包含该论文的收藏集 0

没有收藏集包含此论文

将这篇论文添加到收藏集 (https://huggingface.co/new-collection)，即可从此页面链接。

Squeeze-Release: 迭代剪枝与精确结构最小化

论文页面 - Squeeze-Release: 基于精确结构最小化的迭代剪枝

引用该论文的模型 0

引用该论文的数据集 0

引用该论文的 Spaces 0

包含该论文的收藏集 0

相似文章

基于归因引导和覆盖最大化的结构化MoE压缩剪枝

用于大语言模型压缩的联合结构化剪枝与混合精度量化

SHAPE: 面向稀疏混合专家大语言模型的联盟感知专家剪枝

SlimQwen：探索大规模MoE模型预训练中的剪枝与蒸馏

基于半监督伪标签的标签高效数据集剪枝

提交意见反馈