理解并强制任务算术中的权重解耦

Hugging Face Daily Papers 2026/04/18 17:34 论文

摘要

本文提出即插即用正则项 OrthoReg，通过在微调阶段强制权重正交，无需额外计算即可提升任务算术与模型融合效果。

任务算术提供了一种无需训练的、高效的预训练模型编辑方式，但其成功背后缺乏基础理论解释。现有“权重解耦”概念描绘了任务组合互不干扰的理想结果，却未揭示其根本原因。关键问题在于：预训练模型 (θ_0) 或任务向量 (τ_t) 的哪些内在属性能够促成这种解耦，仍待深入探索。本文提出任务特征特化（TFS）——模型为不同任务分配独立内部特征的能力——作为根本原理。我们首先证明 TFS 是权重解耦的充分条件；更重要的是，TFS 还会产生可观测的几何结果：权重向量正交。由此，TFS 成为功能目标（解耦）与可测几何属性（正交）的共同成因。该关系为我们的方法提供关键洞见：既然抽象的 TFS 属性难以直接强制，我们可通过塑造其具体几何结果——正交——来促进权重解耦。为此，我们提出 OrthoReg，一种简单有效的正则化方法，在微调阶段主动对构成 τ_t 的权重更新 (ΔW) 施加内部正交结构。我们理论上证明 OrthoReg 能促进解耦。大量实验表明，OrthoReg 能持续且显著提升各种任务算术方法的性能。代码已开源：https://github.com/RL-MIND/OrthoReg

查看原文

查看缓存全文

缓存时间: 2026/04/22 10:35

论文页面 - 理解并强化任务算术中的权重解耦

来源：https://huggingface.co/papers/2604.17078

大家好！🤗 我们非常激动地分享刚刚被 CVPR 2026 接收的最新工作：《理解并强化任务算术中的权重解耦》。

如果你对模型合并和任务算术感兴趣，这里有一份快速导读，告诉你我们做了什么以及怎么用！

💡 核心问题：任务算术为什么有效？
虽然通过加减“任务向量”来编辑模型优雅且无需再训练，但其内在机制一直成谜。我们从理论上证明：任务-特征特化（TFS） 是权重解耦的充分条件。更重要的是，TFS 会自然引出一种可观测的几何性质：权重向量正交性。

🛠️ 我们的方案：OrthoReg
由于直接约束抽象的特征特化难以实现，我们提出 OrthoReg——一个简单、即插即用的正则项，可直接加到标准微调损失里。它在微调过程中主动对权重更新 ΔW 按列施加正交约束。

损失函数极其简洁：
L = L_task + λ·Σ_l‖(ΔW^(l))^⊤ΔW^(l) − I‖_F²

📊 主要结果

一致提升：在 ViT-B-32、ViT-B-16、ViT-L-14 上，显著改善多种任务算术基线（Non-linear FT、TTA、ATT-FT、LoRA）的性能。
高效轻量：达到 Tangent Task Arithmetic（TTA）的解耦效果，却无需承担庞大的雅可比矩阵计算开销。
更干净的遗忘：大幅提升“任务取反”（让模型遗忘特定任务）能力，同时对通用能力副作用极小。

🔗 资源
我们坚信开放科学，已公开全部成果：

💻 GitHub 仓库：RL-MIND/OrthoReg（https://github.com/RL-MIND/OrthoReg）
🤗 模型检查点：RL-MIND/OrthoReg_checkpoints（https://huggingface.co/RL-MIND/OrthoReg_checkpoints）
（8 个任务、6 种模式的所有微调检查点都已上传至 Hugging Face！）

期待听到你的想法、反馈或任何问题，欢迎在下方留言！👇

理解并强制任务算术中的权重解耦

论文页面 - 理解并强化任务算术中的权重解耦

相似文章

循环权重空间中的任务受限对称性

Grokking Transformer中的权重衰减机制：廉价在线诊断

离线推理训练中的权重空间几何

LoRA 与权重衰减 (2023)

分解大语言模型的基本能力：在多任务指令微调中缓解跨任务干扰

提交意见反馈