关于PEFT的规模化:迈向万亿参数的百万个性化模型
摘要
本文探索将参数高效微调(PEFT)用作持久化个性化模型的紧凑基底,研究了向上、向下和向外扩展,并介绍了用于管理适配器的MinT。
查看缓存全文
缓存时间: 2026/06/02 03:23
论文页面 - 论PEFT的扩展:迈向百万个性化模型与万亿参数
来源:https://huggingface.co/papers/2606.02437 发布于6月1日
#1 今日论文 (https://huggingface.co/papers/date/2026-06-02) 作者:
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
摘要
参数高效微调(Parameter-efficient fine-tuning,PEFT)通常被视为全参数微调(full fine-tuning)的更廉价替代方案。我们研究其更广泛的角色:将小型可训练适配器(trainable adapters)作为强共享基础模型(shared foundation models)之上的持久本地状态(persistent local state)。在此框架下,基础模型提供共享能力,而适配器承载实例特定行为(instance-specific behavior),如偏好、技能、工具习惯以及类似记忆的更新。我们围绕三个扩展维度组织问题:向上扩展(Scale Up),即更强的共享先验(shared priors)使小型局部更新更有用;向下扩展(Scale Down),研究适配器在小到何种程度时仍保持可靠;向外扩展(Scale Out),即众多持久的适配实例共存。MinT 提供了一个基础设施示例,用于管理适配器身份(adapter identity)、版本(revision)、来源(provenance)、评估(evaluation)和服务驻留(serving residency)。综合来看,这些结果表明 PEFT 可以成为持久个性化模型的紧凑基座,而不仅仅是全参数微调(full fine-tuning)的预算替代品。
查看 arXiv 页面 (https://arxiv.org/abs/2606.02437)查看 PDF (https://arxiv.org/pdf/2606.02437)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.02437)
引用本文的模型0
暂无模型关联此论文
请在你的模型 README.md 中引用 arxiv.org/abs/2606.02437,即可在此页面建立链接。
引用本文的数据集0
暂无数据集关联此论文
请在你的数据集 README.md 中引用 arxiv.org/abs/2606.02437,即可在此页面建立链接。
引用本文的 Spaces0
暂无 Space 关联此论文
请在你的 Space README.md 中引用 arxiv.org/abs/2606.02437,即可在此页面建立链接。
包含本文的收藏集0
暂无收藏集包含此论文
将此论文添加到收藏集 (https://huggingface.co/new-collection)中,即可在此页面建立链接。
相似文章
ShadowPEFT:面向参数高效微调的阴影网络
ShadowPEFT 提出一种集中式参数高效微调方法,通过深度共享的阴影模块细化 Transformer 层表示,在可训练参数量与 LoRA/DoRA 相当的情况下实现同等甚至更优的性能。
@_vmlops:在单GPU上微调12B模型已成现实 大多数人以为需要庞大的GPU集群才能微调大型语言模型…
Hugging Face 的 PEFT 库实现了在单张 GPU 上对大型模型进行参数高效微调,在降低计算和存储成本的同时保持性能。
如何扩展混合专家模型:从muP到最大化尺度稳定参数化
本文为混合专家(MoE)架构提出了一套具有理论基础的缩放理论,引入了最大化尺度稳定参数化(MSSP),确保在宽度、深度、专家宽度和专家数量上的稳定训练和超参数迁移,并通过实验验证。
从参数到数据:一种任务参数引导的高效LLM对齐微调流水线
P2D是一个统一框架,利用任务敏感的注意力头进行数据选择和结构剪枝,通过仅更新10%的头部和10%的数据,实现了8.3个百分点的性能提升和7.0倍的加速。
PEML:面向优化连续提示的参数高效多任务学习
PEML提出了一种参数高效的多任务学习方法,通过低秩自适应共同优化连续提示和模型权重。在多个基准测试上,平均准确率提升高达6.67%。