svd

标签

Cards List
#svd

尾巴中的捷径:通过微调更新的后验谱压缩进行去偏

arXiv cs.LG · 17小时前 缓存

一种后验方法通过截断权重更新矩阵SVD的尾部来减少微调大语言模型中的虚假相关性。该方法在不重新训练或使用群体标签的情况下,将虚假群体差距最多减少5倍,精度损失小于2个百分点。

0 人收藏 0 人点赞
#svd

SigmaScale:基于SVD低秩分解与学习缩放矩阵的LLM压缩方法

arXiv cs.CL · 昨天 缓存

介绍SigmaScale,一种为基于SVD的LLM压缩学习辅助缩放矩阵的方法,在Llama 3.1 8B和Qwen3-8B基准测试上展现出具有竞争力的性能。

0 人收藏 0 人点赞
#svd

谱遗忘恢复:无需重新训练即可事后恢复受损能力

arXiv cs.LG · 2026-05-21 缓存

本文提出DG-Hard,一种事后谱修复方法,仅使用预训练和微调检查点,即可恢复因微调而受损的能力,无需重新训练。该方法将Donoho-Gavish硬奇异值阈值应用于权重更新,去除噪声并恢复退化的性能。

0 人收藏 0 人点赞
#svd

CERSA:一种用于内存高效微调的累积能量保留子空间自适应方法

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 CERSA,这是一种新颖的参数高效微调方法,它利用奇异值分解来保留主成分,在显著降低内存使用的同时,其表现优于 LoRA 等现有方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈