peft

#peft

当Top-1失效时：为掩码扩散语言模型校准LoRA监控器

arXiv cs.LG ↗ · 2天前缓存

本文研究了top-1崩溃率作为短视界LoRA微调离散扩散语言模型的稳定性监控器的有效性，发现其精度为零，并提出最大梯度范数作为更可靠的替代方案，在LLaDA系列模型上具有更高的精度和F1分数。

0 人收藏 0 人点赞

#peft

ARIADNE：推理时适配器动态选择的无关路由

arXiv cs.AI ↗ · 2026-06-18 缓存

提出ARIADNE，一种无需训练、适配器无关的路由框架，通过在嵌入空间中测量输入与适配器特定质心的接近度，在推理时选择最优的PEFT适配器，在23个任务上恢复了97.44%的上限性能。

0 人收藏 0 人点赞

#peft

超越LoRA：你能击败最流行的微调技术吗？

Hugging Face Blog ↗ · 2026-06-18 缓存

探讨LoRA是否是最佳参数高效微调技术，并介绍PEFT库中用于比较方法的工具。

0 人收藏 0 人点赞

#peft

微调陷阱：评估负迁移与PEFT在Sub-1B数学推理中的作用

arXiv cs.LG ↗ · 2026-06-08 缓存

本文对Sub-1B模型在数学推理任务上进行了基准测试，揭示全量微调会主动损害300M参数以下模型的性能，而LoRA和DoRA等参数高效微调（PEFT）则提供了稳定性。作者建议对所有对齐的Sub-1B模型默认使用PEFT，并警告不要对小于500M参数的架构使用全量微调，以防止灾难性遗忘。

0 人收藏 0 人点赞

#peft

将聊天中的每个"不，我不是这个意思"转化为实际的LoRA训练数据

Reddit r/LocalLLaMA ↗ · 2026-05-27

一个桌面应用，让用户可以在聊天中纠正模型回复并本地训练LoRA适配器，无需手动使用笔记本即可闭环反馈。

0 人收藏 0 人点赞

#peft

KappaTune 现已加入 Hugging Face 的 PEFT

Reddit r/ArtificialInteligence ↗ · 2026-05-20

KappaTune，一种旨在缓解灾难性遗忘的微调方法，已被集成到 Hugging Face 的 PEFT 库中。

0 人收藏 0 人点赞

#peft

@_vmlops：在单GPU上微调12B模型已成现实大多数人以为需要庞大的GPU集群才能微调大型语言模型…

X AI KOLs Timeline ↗ · 2026-05-17 缓存

Hugging Face 的 PEFT 库实现了在单张 GPU 上对大型模型进行参数高效微调，在降低计算和存储成本的同时保持性能。

0 人收藏 0 人点赞

#peft

Echo-LoRA：通过跨层表示注入实现参数高效微调

arXiv cs.LG ↗ · 2026-05-12 缓存

本文介绍了 Echo-LoRA，这是一种新的参数高效微调方法，它将来自深层源层的跨层表示注入到浅层 LoRA 模块中，从而在不增加推理开销的情况下提升性能。

0 人收藏 0 人点赞

#peft

CERSA：一种用于内存高效微调的累积能量保留子空间自适应方法

arXiv cs.LG ↗ · 2026-05-12 缓存

本文介绍了 CERSA，这是一种新颖的参数高效微调方法，它利用奇异值分解来保留主成分，在显著降低内存使用的同时，其表现优于 LoRA 等现有方法。

0 人收藏 0 人点赞

#peft

ShadowPEFT：面向参数高效微调的阴影网络

arXiv cs.CL ↗ · 2026-04-22 缓存

ShadowPEFT 提出一种集中式参数高效微调方法，通过深度共享的阴影模块细化 Transformer 层表示，在可训练参数量与 LoRA/DoRA 相当的情况下实现同等甚至更优的性能。

0 人收藏 0 人点赞

peft

提交意见反馈