sparse-adapters

标签

Cards List
#sparse-adapters

JumpLoRA:大语言模型持续学习的稀疏适配器

arXiv cs.CL · 2026-04-20 缓存

JumpLoRA 引入了一个新颖的稀疏适配器框架,用于大语言模型的持续学习。该方法使用 JumpReLU 门控来动态隔离任务参数并防止灾难性遗忘。它增强了基于 LoRA 的方法,并超越了 ELLA 等最先进的持续学习方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈