通过梯度手术的持续学习低秩适配器初始化
摘要
该论文提出了Slice,一种基于梯度手术的LoRA适配器初始化方法,用于持续学习,通过调和当前任务和过去任务的冲突梯度来减少灾难性遗忘,实现了更好的稳定性-可塑性权衡。
arXiv:2605.12752v1 公告类型:新
摘要:LoRA因其参数效率、跨任务的模块化以及与重放策略的兼容性,被广泛用于大型语言模型的持续微调。然而,基于LoRA的持续学习仍然容易受到灾难性遗忘的影响,其严重程度取决于连续任务梯度的相互作用:当连续任务梯度冲突时,标准的适配器初始化将更新引导至覆盖先前学习方向的子空间。我们提出SLICE,一种基于梯度手术的持续学习LoRA适配器初始化方法。SLICE累积当前任务和先前任务的重放缓冲区中的梯度,通过投影算子进行调和,并通过截断SVD分解结果来初始化适配器权重。我们在TRACE基准和Super-NI任务序列上评估SLICE,包括我们通过挖掘具有最大相反梯度的任务对构建的一组对抗性Super-NI序列。与原始LoRA、LoRA-GA和LoRAM相比,SLICE在标准和对抗性持续学习序列上一致地实现了更好的稳定性-可塑性权衡,提高了平均性能、最终性能和遗忘指标,同时保持了通用性能和上下文内性能。
查看缓存全文
缓存时间: 2026/05/14 06:18
# 基于梯度手术的低秩适配器初始化用于持续学习 来源:https://arxiv.org/html/2605.12752 Joana Pasquali同等贡献MALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Ramiro N\. Barros同等贡献MALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Arthur S\. BianchessiVinícius Conte TuraniMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西João Vitor Boer AbitanteMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Rafaela Cappelari RavazioMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Christian MattjieMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Otávio ParragaMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Lucas S\. KupssinsküMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Rodrigo C\. BarrosMALTA,机器学习理论与应用实验室,PUCRS,阿雷格里港,巴西Kunumi Institute,巴西 ###### 摘要 LoRA 因其参数效率、跨任务的模块化以及与重放策略的兼容性,被广泛用于大型语言模型的持续微调。然而,基于 LoRA 的持续学习仍然容易受到灾难性遗忘的影响,其严重程度取决于相继任务梯度的交互方式:当连续任务梯度冲突时,标准适配器初始化会将更新引导至覆盖先前学习方向的子空间。我们提出了 SLICE,一种基于梯度手术的 LoRA 适配器初始化方法,用于持续学习。SLICE 从当前任务和先前任务的重放缓冲区中累积梯度,通过投影算子协调它们,并通过截断奇异值分解将结果分解以初始化适配器权重。我们在 TRACE 基准测试和 Super-NI 任务序列上评估了 SLICE,包括我们通过挖掘具有最大相反梯度的任务对构建的一组对抗性 Super-NI 序列。与 vanilla LoRA、LoRA-GA 和 LoRAM 相比,SLICE 在标准和对抗性持续学习序列上一致地实现了更好的稳定性-可塑性权衡,提高了平均性能、最终性能和遗忘指标,同时保持了一般性能和上下文性能。 ## 1 引言 大型语言模型(LLMs)越来越多地部署在需要顺序适应非平稳任务分布的场景中:新领域、不断演变的指令和变化的用户需求随时间出现,而每个阶段从头开始重新训练的成本高得令人望而却步。持续学习(CL)为此类场景提供了自然框架[shi2025continualsurvey],但其核心病理——灾难性遗忘[kirkpatrick2017overcoming],即对新任务的优化会降低先前学习任务的性能——仍然是一个基本障碍。 低秩适配(LoRA)[hu2022lora]是主要的参数高效微调范式,它为CL提供了若干优势:其低参数数量限制了破坏性干扰的自由度,其模块化支持特定任务的适配器存储和组合,其与重放和正则化策略的兼容性使其适用于CL[liang2024inflora, liu2024learningattentionalmixtureloras, wang2023olora, xiong2026oplora]。 在CL中,当新任务的梯度与先前学习任务的梯度冲突时——即当它们的弗罗贝尼乌斯内积为负时——任何提高当前任务性能的
相似文章
JumpLoRA:大语言模型持续学习的稀疏适配器
JumpLoRA 引入了一个新颖的稀疏适配器框架,用于大语言模型的持续学习。该方法使用 JumpReLU 门控来动态隔离任务参数并防止灾难性遗忘。它增强了基于 LoRA 的方法,并超越了 ELLA 等最先进的持续学习方法。
超越 LoRA 与全参数微调:基于梯度引导优化器路由的大语言模型适配
本文提出了一种混合 LoRA 与全参数微调(MoLF)框架,利用梯度引导的优化器路由在 LoRA 和全参数微调之间进行自适应切换。旨在通过结合全参数微调的可塑性与 LoRA 的正则化特性,克服仅依赖静态适配方法的结构局限性。
GRPO 下基于梯度的 LoRA 秩分配:一项实证研究
本研究通过实证表明,在监督微调中有效的基于梯度的 LoRA 秩分配,在基于 GRPO 的强化学习中会导致性能下降,原因在于梯度景观更为平缓以及存在梯度放大效应。
基于可学习秩的参数高效微调
来自阿德莱德大学的研究人员提出了 LR-LoRA(可学习秩 LoRA),这是一种参数高效微调方法,在训练过程中动态学习每个 Transformer 层的适配器秩,而非使用固定的全局秩。LR-LoRA 在语言理解和常识推理基准测试上达到了最先进的性能,超越了固定秩 LoRA 基线。
CSULoRA: 最接近安全更新的低秩适应
CSULoRA是一种事后方法,用于纠正训练后的LoRA适配器,以在保持实用性的同时保留安全对齐,该方法利用最接近安全更新估计。