peft

标签

Cards List
#peft

当Top-1失效时:为掩码扩散语言模型校准LoRA监控器

arXiv cs.LG · 2天前 缓存

本文研究了top-1崩溃率作为短视界LoRA微调离散扩散语言模型的稳定性监控器的有效性,发现其精度为零,并提出最大梯度范数作为更可靠的替代方案,在LLaDA系列模型上具有更高的精度和F1分数。

0 人收藏 0 人点赞
#peft

ARIADNE:推理时适配器动态选择的无关路由

arXiv cs.AI · 2026-06-18 缓存

提出ARIADNE,一种无需训练、适配器无关的路由框架,通过在嵌入空间中测量输入与适配器特定质心的接近度,在推理时选择最优的PEFT适配器,在23个任务上恢复了97.44%的上限性能。

0 人收藏 0 人点赞
#peft

超越LoRA:你能击败最流行的微调技术吗?

Hugging Face Blog · 2026-06-18 缓存

探讨LoRA是否是最佳参数高效微调技术,并介绍PEFT库中用于比较方法的工具。

0 人收藏 0 人点赞
#peft

微调陷阱:评估负迁移与PEFT在Sub-1B数学推理中的作用

arXiv cs.LG · 2026-06-08 缓存

本文对Sub-1B模型在数学推理任务上进行了基准测试,揭示全量微调会主动损害300M参数以下模型的性能,而LoRA和DoRA等参数高效微调(PEFT)则提供了稳定性。作者建议对所有对齐的Sub-1B模型默认使用PEFT,并警告不要对小于500M参数的架构使用全量微调,以防止灾难性遗忘。

0 人收藏 0 人点赞
#peft

将聊天中的每个"不,我不是这个意思"转化为实际的LoRA训练数据

Reddit r/LocalLLaMA · 2026-05-27

一个桌面应用,让用户可以在聊天中纠正模型回复并本地训练LoRA适配器,无需手动使用笔记本即可闭环反馈。

0 人收藏 0 人点赞
#peft

KappaTune 现已加入 Hugging Face 的 PEFT

Reddit r/ArtificialInteligence · 2026-05-20

KappaTune,一种旨在缓解灾难性遗忘的微调方法,已被集成到 Hugging Face 的 PEFT 库中。

0 人收藏 0 人点赞
#peft

@_vmlops:在单GPU上微调12B模型已成现实 大多数人以为需要庞大的GPU集群才能微调大型语言模型…

X AI KOLs Timeline · 2026-05-17 缓存

Hugging Face 的 PEFT 库实现了在单张 GPU 上对大型模型进行参数高效微调,在降低计算和存储成本的同时保持性能。

0 人收藏 0 人点赞
#peft

Echo-LoRA:通过跨层表示注入实现参数高效微调

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 Echo-LoRA,这是一种新的参数高效微调方法,它将来自深层源层的跨层表示注入到浅层 LoRA 模块中,从而在不增加推理开销的情况下提升性能。

0 人收藏 0 人点赞
#peft

CERSA:一种用于内存高效微调的累积能量保留子空间自适应方法

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 CERSA,这是一种新颖的参数高效微调方法,它利用奇异值分解来保留主成分,在显著降低内存使用的同时,其表现优于 LoRA 等现有方法。

0 人收藏 0 人点赞
#peft

ShadowPEFT:面向参数高效微调的阴影网络

arXiv cs.CL · 2026-04-22 缓存

ShadowPEFT 提出一种集中式参数高效微调方法,通过深度共享的阴影模块细化 Transformer 层表示,在可训练参数量与 LoRA/DoRA 相当的情况下实现同等甚至更优的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈