efficient-fine-tuning

标签

Cards List
#efficient-fine-tuning

SLAP:用于在线策略数据高效指令微调的分层损失剪枝方法

arXiv cs.CL · 2026-05-26 缓存

提出SLAP,一种用于大型语言模型高效指令微调的新型数据选择框架,它评估批次可学习性并采用分层采样,以在减少20-40%训练数据的情况下实现卓越性能。

0 人收藏 0 人点赞
#efficient-fine-tuning

从参数到数据:一种任务参数引导的高效LLM对齐微调流水线

arXiv cs.LG · 2026-05-22 缓存

P2D是一个统一框架,利用任务敏感的注意力头进行数据选择和结构剪枝,通过仅更新10%的头部和10%的数据,实现了8.3个百分点的性能提升和7.0倍的加速。

0 人收藏 0 人点赞
#efficient-fine-tuning

Hybrid-LoRA:桥接全微调与低秩适应的后训练方法

arXiv cs.LG · 2026-05-20

Hybrid-LoRA提出了一种框架,选择性地对一小部分模块进行全微调,同时对其他模块使用LoRA,在显著降低计算成本的同时实现了接近全微调的性能。实验表明,与现有参数高效基线方法相比,性能提升高达5.65%。

0 人收藏 0 人点赞
#efficient-fine-tuning

FAAST:通过闭式快速权重实现的前馈联想学习,用于测试时监督适应

Hugging Face Daily Papers · 2026-05-08 缓存

FAAST提出了一种前馈方法,通过解析方式将标注样本编译为快速权重,无需反向传播即可实现高效的测试时监督适应,在保持性能的同时提升90%以上的速度和节省95%的内存。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈