MixSD：混合上下文自蒸馏知识注入

Hugging Face Daily Papers 2026/05/16 00:00 论文

摘要

MixSD 提出了一种面向语言模型知识注入的自蒸馏方法，该方法将监督信号与模型自身的原生分布对齐，从而减少微调过程中的灾难性遗忘。它能够实现近乎完美的记忆，同时保留高达 100% 的基础能力，远超标准 SFT。

监督微调（SFT）被广泛用于向语言模型注入新知识，但它常常损害预训练能力，如推理和通用领域性能。我们认为这种遗忘的产生是因为来自人类或外部系统的微调目标与模型的自回归分布存在偏差，迫使优化器去模仿低概率的 token 序列。为解决这一问题，我们提出了 MixSD，一种无需外部教师的简单方法，用于分布对齐的知识注入。与在固定目标上训练不同，MixSD 通过混合基础模型本身的两个条件分布来动态构建监督信号：一个专家条件，它能在上下文中观察到注入的事实；一个朴素条件，它反映模型的原始先验。由此产生的监督序列既保留了事实学习信号，又显著更接近基础模型的分布。我们在两个合成语料库上评估了 MixSD，这些语料库是为在受控环境中研究事实回忆和算术函数习得而构建的，同时使用了开放域事实问答和知识编辑的既有基准。在多个模型规模和设置下，与 SFT 和在线策略自蒸馏基线相比，MixSD 始终实现了更好的记忆-保留权衡，在保持近乎完美的训练准确率的同时，保留了基础模型高达 100% 的预留能力，而标准 SFT 仅保留 1%。我们进一步证明，MixSD 在基础模型下生成了显著更低的负对数似然（NLL）监督目标，并减少了沿 Fisher 敏感参数方向的有害移动。这些结果表明，将监督信号与模型的原生生成分布对齐是一种简单有效的知识注入原则，能够缓解灾难性遗忘。

查看原文

查看缓存全文

缓存时间: 2026/05/19 06:30

论文页面 - MixSD: 混合上下文自蒸馏用于知识注入

来源：https://huggingface.co/papers/2605.16865

摘要

MixSD 通过使监督信号与模型的原生生成分布对齐来解决语言模型中的知识注入问题，从而减少微调过程中的灾难性遗忘。

监督微调（SFT）广泛用于向语言模型注入新知识，但往往会损害预训练能力，如推理和通用领域性能。我们认为这种遗忘的产生是因为来自人类或外部系统的微调目标与模型的自回归分布存在偏差，迫使优化器去模仿低概率的 token 序列。为了解决这个问题，我们提出了 MixSD，一种无需外部教师、基于分布对齐的简单知识注入方法。MixSD 并非在固定目标上训练，而是动态构建监督信号：它混合基础模型自身两种条件生成下的 token——一种是包含注入事实上下文的专家条件，另一种是反映模型原始先验的朴素条件。由此产生的监督序列保留了事实学习信号，同时更贴近基础模型的分布。我们在两个合成语料库上评估 MixSD，这两个语料库是为在受控环境下研究事实回忆和算术函数习得而构建的，此外还在开放域事实问答和知识编辑的成熟基准上进行评估。在多个模型规模和设置下，与 SFT 和在线自蒸馏基线相比，MixSD 始终能实现更好的记忆-保留权衡：在保持近完美的训练准确率的同时，最多可保留基础模型 100% 的 hold-out 能力，而标准 SFT 仅能保留 1%。我们进一步证明，MixSD 在基础模型下产生的监督目标具有显著更低的负对数似然，并减少了沿 Fisher 敏感参数方向的有害移动。这些结果表明，使监督信号与模型的原生生成分布对齐是一种简单而有效的知识注入原则，能够缓解灾难性遗忘。

查看 arXiv 页面 (https://arxiv.org/abs/2605.16865)
查看 PDF (https://arxiv.org/pdf/2605.16865)
添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.16865)

在你的代理中获取这篇论文：

hf papers read 2605\.16865

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用本文的模型0

没有模型链接这篇论文

在模型的 README.md 中引用 arxiv.org/abs/2605.16865 以从本页链接它。

引用本文的数据集0

没有数据集链接这篇论文

在数据集的 README.md 中引用 arxiv.org/abs/2605.16865 以从本页链接它。

引用本文的 Space0

没有 Space 链接这篇论文

在 Space 的 README.md 中引用 arxiv.org/abs/2605.16865 以从本页链接它。

包含本文的收藏0

没有收藏包含这篇论文

将此论文添加到一个收藏 (https://huggingface.co/new-collection) 中以从本页链接它。

MixSD：混合上下文自蒸馏知识注入

论文页面 - MixSD: 混合上下文自蒸馏用于知识注入

摘要

引用本文的模型0

引用本文的数据集0

引用本文的 Space0

包含本文的收藏0

相似文章

自蒸馏实现持续学习 [pdf]

UniSD：面向大型语言模型的统一自蒸馏框架

自蒸馏作为大语言模型的性能恢复机制：对抗压缩和灾难性遗忘

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

程序性记忆蒸馏：面向自我改进语言模型的在线反思

提交意见反馈