svd

#svd

尾巴中的捷径：通过微调更新的后验谱压缩进行去偏

arXiv cs.LG ↗ · 17小时前缓存

一种后验方法通过截断权重更新矩阵SVD的尾部来减少微调大语言模型中的虚假相关性。该方法在不重新训练或使用群体标签的情况下，将虚假群体差距最多减少5倍，精度损失小于2个百分点。

0 人收藏 0 人点赞

#svd

arXiv cs.CL ↗ · 昨天缓存

介绍SigmaScale，一种为基于SVD的LLM压缩学习辅助缩放矩阵的方法，在Llama 3.1 8B和Qwen3-8B基准测试上展现出具有竞争力的性能。

0 人收藏 0 人点赞

#svd

arXiv cs.LG ↗ · 2026-05-21 缓存

本文提出DG-Hard，一种事后谱修复方法，仅使用预训练和微调检查点，即可恢复因微调而受损的能力，无需重新训练。该方法将Donoho-Gavish硬奇异值阈值应用于权重更新，去除噪声并恢复退化的性能。

0 人收藏 0 人点赞

#svd

arXiv cs.LG ↗ · 2026-05-12 缓存

本文介绍了 CERSA，这是一种新颖的参数高效微调方法，它利用奇异值分解来保留主成分，在显著降低内存使用的同时，其表现优于 LoRA 等现有方法。

0 人收藏 0 人点赞