efficient-fine-tuning

#efficient-fine-tuning

SLAP：用于在线策略数据高效指令微调的分层损失剪枝方法

arXiv cs.CL ↗ · 2026-05-26 缓存

提出SLAP，一种用于大型语言模型高效指令微调的新型数据选择框架，它评估批次可学习性并采用分层采样，以在减少20-40%训练数据的情况下实现卓越性能。

0 人收藏 0 人点赞

#efficient-fine-tuning

arXiv cs.LG ↗ · 2026-05-22 缓存

P2D是一个统一框架，利用任务敏感的注意力头进行数据选择和结构剪枝，通过仅更新10%的头部和10%的数据，实现了8.3个百分点的性能提升和7.0倍的加速。

0 人收藏 0 人点赞

#efficient-fine-tuning

arXiv cs.LG ↗ · 2026-05-20

Hybrid-LoRA提出了一种框架，选择性地对一小部分模块进行全微调，同时对其他模块使用LoRA，在显著降低计算成本的同时实现了接近全微调的性能。实验表明，与现有参数高效基线方法相比，性能提升高达5.65%。

0 人收藏 0 人点赞

#efficient-fine-tuning

Hugging Face Daily Papers ↗ · 2026-05-08 缓存

FAAST提出了一种前馈方法，通过解析方式将标注样本编译为快速权重，无需反向传播即可实现高效的测试时监督适应，在保持性能的同时提升90%以上的速度和节省95%的内存。

0 人收藏 0 人点赞