关于PEFT的规模化：迈向万亿参数的百万个性化模型

Hugging Face Daily Papers 2026/06/01 00:00 论文

摘要

本文探索将参数高效微调（PEFT）用作持久化个性化模型的紧凑基底，研究了向上、向下和向外扩展，并介绍了用于管理适配器的MinT。

参数高效微调（PEFT）通常被视为全量微调的更廉价替代方案。我们研究一个更广泛的角色：将小型可训练适配器作为强共享基础模型之上的持久化局部状态。在这种框架下，基础模型提供共享能力，而适配器承载实例特定的行为，如偏好、技能、工具习惯和类似记忆的更新。我们围绕三个扩展轴组织问题：向上扩展（Scale Up），更强的共享先验使得局部更新更有用；向下扩展（Scale Down），研究适配器可以多小同时保持可靠；向外扩展（Scale Out），多个持久化适配实例共存。MinT提供了一个基础设施示例，用于管理适配器的身份、修订、来源、评估和服务驻留。综合来看，结果表明PEFT可以作为持久化个性化模型的紧凑基底，而不仅仅是全量微调的预算替代品。

查看原文

查看缓存全文

缓存时间: 2026/06/02 03:23

论文页面 - 论PEFT的扩展：迈向百万个性化模型与万亿参数

来源：https://huggingface.co/papers/2606.02437 发布于6月1日

#1 今日论文 (https://huggingface.co/papers/date/2026-06-02) 作者：

摘要

参数高效微调（Parameter-efficient fine-tuning，PEFT）通常被视为全参数微调（full fine-tuning）的更廉价替代方案。我们研究其更广泛的角色：将小型可训练适配器（trainable adapters）作为强共享基础模型（shared foundation models）之上的持久本地状态（persistent local state）。在此框架下，基础模型提供共享能力，而适配器承载实例特定行为（instance-specific behavior），如偏好、技能、工具习惯以及类似记忆的更新。我们围绕三个扩展维度组织问题：向上扩展（Scale Up），即更强的共享先验（shared priors）使小型局部更新更有用；向下扩展（Scale Down），研究适配器在小到何种程度时仍保持可靠；向外扩展（Scale Out），即众多持久的适配实例共存。MinT 提供了一个基础设施示例，用于管理适配器身份（adapter identity）、版本（revision）、来源（provenance）、评估（evaluation）和服务驻留（serving residency）。综合来看，这些结果表明 PEFT 可以成为持久个性化模型的紧凑基座，而不仅仅是全参数微调（full fine-tuning）的预算替代品。

查看 arXiv 页面 (https://arxiv.org/abs/2606.02437)查看 PDF (https://arxiv.org/pdf/2606.02437)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.02437)

引用本文的模型0

暂无模型关联此论文

请在你的模型 README.md 中引用 arxiv.org/abs/2606.02437，即可在此页面建立链接。

引用本文的数据集0

暂无数据集关联此论文

请在你的数据集 README.md 中引用 arxiv.org/abs/2606.02437，即可在此页面建立链接。

引用本文的 Spaces0

暂无 Space 关联此论文

请在你的 Space README.md 中引用 arxiv.org/abs/2606.02437，即可在此页面建立链接。

包含本文的收藏集0

暂无收藏集包含此论文

将此论文添加到收藏集 (https://huggingface.co/new-collection)中，即可在此页面建立链接。

关于PEFT的规模化：迈向万亿参数的百万个性化模型

论文页面 - 论PEFT的扩展：迈向百万个性化模型与万亿参数

摘要

引用本文的模型0

引用本文的数据集0

引用本文的 Spaces0

包含本文的收藏集0

相似文章

ShadowPEFT：面向参数高效微调的阴影网络

@_vmlops：在单GPU上微调12B模型已成现实大多数人以为需要庞大的GPU集群才能微调大型语言模型…

如何扩展混合专家模型：从muP到最大化尺度稳定参数化

从参数到数据：一种任务参数引导的高效LLM对齐微调流水线

PEML：面向优化连续提示的参数高效多任务学习

提交意见反馈

论文页面 - 论PEFT的扩展：迈向百万个性化模型与万亿参数

摘要

引用本文的模型0

引用本文的数据集0

引用本文的 Spaces0

包含本文的收藏集0

相似文章

ShadowPEFT：面向参数高效微调的阴影网络

@_vmlops：在单GPU上微调12B模型已成现实 大多数人以为需要庞大的GPU集群才能微调大型语言模型…

如何扩展混合专家模型：从muP到最大化尺度稳定参数化

从参数到数据：一种任务参数引导的高效LLM对齐微调流水线

PEML：面向优化连续提示的参数高效多任务学习

提交意见反馈

@_vmlops：在单GPU上微调12B模型已成现实大多数人以为需要庞大的GPU集群才能微调大型语言模型…