MMD球作为信度集:测试时自适应中认知不确定性的PAC-贝叶斯框架

arXiv cs.LG 论文

摘要

本文开发了一种用于测试时自适应的PAC-贝叶斯框架,该框架使用MMD球作为信度集,提供了形式化的泛化界,并在分布偏移下区分认知不确定性与偶然不确定性。

arXiv:2605.21783v1 公告类型:新 摘要:测试时自适应(TTA)方法在分布偏移下提升了模型性能,但缺乏将偏移幅度与预测可靠性联系起来的正式保证。我们开发了一个PAC-贝叶斯框架,得到了由源分布与目标分布之间的最大均值差异(MMD)显式参数化的泛化界。我们的主要贡献是将源分布周围的MMD球解释为Walley不精确概率理论中的信度集,从而自然地实现了认知不确定性量化。我们建立了:(i) 在RKHS-Lipschitz损失假设下,具有MMD相关偏移惩罚的PAC-贝叶斯界;(ii) 通过MMD集中性的有限样本版本;(iii) 信度集中所有分布上的统一最坏情况风险界,并具有上下风险分解;(iv) 测地线保持界,解释了为什么核引导自适应保护局部特征几何。信度集解释将认知不确定性与偶然不确定性分开,并提供了何时有必要进行自适应的原则性决策准则。
查看原文
查看缓存全文

缓存时间: 2026/05/22 08:52

# MMD-球体作为信度集:测试时自适应中认知不确定性的PAC-贝叶斯框架

来源:https://arxiv.org/html/2605.21783

###### 摘要

测试时自适应(TTA)方法在分布偏移下提升了模型性能,但缺乏将偏移幅度与预测可靠性相联系的形式化保证。我们开发了一个PAC-贝叶斯框架,其泛化界显式由源分布与目标分布之间的最大均值差异(MMD)参数化。我们的主要贡献是将源分布周围的MMD-球体解释为Walley非精确概率理论中的信度集,从而自然地实现了认知不确定性量化。我们建立了:(i) 在RKHS-利普希茨损失假设下,带有MMD相关偏移惩罚项的PAC-贝叶斯界;(ii) 通过MMD集中性得到的有限样本版本;(iii) 信度集中所有分布上的统一最坏情况风险界,带有下-上风险分解;(iv) 测地线保持界,解释了为何核引导的自适应能保护局部特征几何。信度集解释将认知不确定性与偶然不确定性区分开来,并为何时需要进行自适应提供了基于原则的决策准则。

## 1 引言

机器学习模型的可靠部署要求对认知不确定性进行推理——即能够识别出运行分布已超出训练时所遇到的范围。这一挑战是测试时自适应(TTA)的核心,在此范式中,部署时模型接收来自目标分布 \(P_t \neq P_s\) 的无标签数据,该模型已在源分布 \(P_s\) 上预训练。现有的TTA方法(Wang等人,2021;Niu等人,2023;Zhang等人,2022a;Yuan等人,2023;Su等人,2022)通过使用从测试批次计算的统计量调整模型参数,提高了分布偏移下的准确性,但它们在预测何时应该被信任或风险如何随偏移幅度退化方面没有提供形式化保证。

这一差距在安全关键应用中尤为令人担忧,例如自动驾驶、医学成像和金融风险评估,在这些应用中,模型在分布偏移下无声地退化可能导致重大危害。无法量化模型在未见环境中的预测可能有多错误,从根本上限制了其可信赖的部署。尽管预测不确定性方法(例如,贝叶斯神经网络、集成方法)试图解决这个问题,但它们混淆了偶然不确定性(固有的数据噪声)与认知不确定性(由于对数据生成过程的有限知识而产生的不确定性),并且没有提供分布偏移与风险之间的形式化联系。

我们形式化了核心问题:能否将目标风险作为分布偏移的函数进行界定,并且这是否提供了可操作的认知不确定性?我们通过一个带有显式MMD相关泛化界的PAC-贝叶斯框架给出了肯定的回答。我们的核心见解是,MMD-球体 \(\mathcal{C}_\varepsilon(P_s) = \{Q: \mathrm{MMD}(P_s,Q) \leq \varepsilon\}\) 定义了一个信度集(Walley,1991;Troffaes 和 Destercke,2023)——一组在分辨率 \(\varepsilon\) 下与源分布无法区分的概率分布。这种解释为TTA中的认知不确定性量化提供了一个基于原则的基础,该基础同时植根于核方法和非精确概率理论。

贡献:

- • 一个PAC-贝叶斯界(定理1 (https://arxiv.org/html/2605.21783#Thmtheorem1)),带有MMD相关的偏移惩罚项,以及一个有限样本版本(定理3 (https://arxiv.org/html/2605.21783#Thmtheorem3)),具有极小化最优的集中速率。
- • 一个信度集解释(命题7 (https://arxiv.org/html/2605.21783#Thmtheorem7)),在整个MMD-球体上产生最坏情况风险保证,以及一个下-上风险分解(推论9 (https://arxiv.org/html/2605.21783#Thmtheorem9)),将认知不确定性与偶然不确定性区分开来。
- • 测地线保持界(命题10 (https://arxiv.org/html/2605.21783#Thmtheorem10)),解释了为何核引导的自适应能保护局部特征几何,以及对稀有类鲁棒性的启示(推论11 (https://arxiv.org/html/2605.21783#Thmtheorem11))。
- • 一个统一的框架,首次将PAC-贝叶斯泛化、核均值嵌入和Walley的非精确概率理论联系起来。

## 2 相关工作

**测试时自适应。** 自从TENT(Wang等人,2021)证明了在测试批次统计量上进行熵最小化可以有效地自适应批归一化参数以来,TTA范式迅速扩展。综述(Zhang等人,2022b)将后续方法分类为基于熵的方法(EATA (Zhang等人,2022a),引入了熵感知选择)、基于正则化的方法(SAR (Niu等人,2023),添加了尖锐度感知正则化以防止误差累积)和基于记忆的方法(MEMO (Zhang等人,2022a),使用增强记忆库来维持类源表示)。最近的工作还探索了测试时的对比学习(Yuan等人,2023)和通过锚定聚类进行的顺序自适应(Su等人,2022)。然而,所有这些方法都缺乏不确定性量化:它们无法在自适应不必要或预测不可靠时发出信号。我们的理论框架通过提供显式依赖于偏移幅度的形式化界来填补这一空白。

**核方法与MMD。** 最大均值差异(MMD)(Gretton等人,2012)通过将分布嵌入到再生核希尔伯特空间(RKHS)并计算其核均值嵌入之间的距离来度量分布散度。核均值嵌入(Muandet等人,2017)提供了一个统一的表示框架,支持非参数双样本检验、密度估计和分布回归。MMD估计量的有限样本集中性质已被精确刻画:对于取值在 \([0,1]\) 中的核,无偏估计量满足次高斯集中不等式(Sutherland等人,2017),极小化估计率为 \(O(1/\sqrt{n})\)(Tolstikhin等人,2017)。这些结果对我们的有限样本分析(定理3 (https://arxiv.org/html/2605.21783#Thmtheorem3))至关重要。

**PAC-贝叶斯理论。** PAC-贝叶斯界(McAllester,1999;Germain等人,2016;Seeger,2002;Catoni,2007;Rivasplata等人,2020;Alquier,2024)通过惩罚后验相对于先验的复杂度(由Kullback-Leibler散度度量)来提供数据依赖的泛化保证。这些界一致地适用于所有可能的后验,使其非常适合在观察数据后选择后验的自适应场景。Germain等人(Germain等人,2013)使用域之间的 \(\mathcal{H}\)-散度(Ben-David等人,2010)推导了域自适应的PAC-贝叶斯界。我们的工作在三个关键方面有所不同:(i) 我们使用MMD(一种可计算的基于核的散度),而不是难以估计的 \(\mathcal{H}\)-散度(NP-难);(ii) 我们提供了一个带有样本量显式依赖的有限样本版本;(iii) 我们将偏移惩罚项解释为信度集,从而与非精确概率相联系。

**非精确概率与信度集。** Walley(Walley,1991)的行为主义非精确概率理论通过概率分布集(信度集)而不是单一分布来建模认知不确定性。由信度集诱导的下概率和上概率量化了在给定可用证据下合理信念的范围。信度分类器(Destercke等人,2008;Corani等人,2022)通过维护类别标签上的概率测度集将其扩展到分类。下-上概率的形式化在(Miranda和Zaffalon,2022)中得到了发展。Hüllermeier & Waegeman(Hüllermeier和Waegeman,2021)有力地论证了,机器学习中有意义的不确定性量化需要区分偶然性和认知性来源——我们的框架自然地提供了这种区分。据我们所知,我们是第一个通过MMD诱导的信度集来形式化TTA不确定性的研究。

## 3 预备知识

**再生核希尔伯特空间(RKHS)记号。** 令 \((\mathcal{X}, \Sigma)\) 为可测空间,令 \(\mathcal{H}\) 为函数 \(f: \mathcal{X} \to \mathbb{R}\) 的RKHS,具有正定核 \(k: \mathcal{X} \times \mathcal{X} \to \mathbb{R}\)。根据再生性质,每个函数 \(f \in \mathcal{H}\) 满足 \(f(x) = \langle f, k(x, \cdot) \rangle_\mathcal{H}\)。特征映射 \(\phi: \mathcal{X} \to \mathcal{H}\) 定义为 \(\phi(x) = k(x, \cdot)\),使得 \(k(x, y) = \langle \phi(x), \phi(y) \rangle_\mathcal{H}\)。

对于概率测度 \(P\) 在 \(\mathcal{X}\) 上,且满足 \(\int k(x,x) \, dP(x) < \infty\),核均值嵌入定义为

\[
\mu_P = \mathbb{E}_{x \sim P}[\phi(x)] = \int \phi(x) \, dP(x) \in \mathcal{H}. \tag{1}
\]

当核 \(k\) 具有特征性(Muandet等人,2017)时,嵌入 \(\mu_P\) 唯一确定 \(P\),且映射 \(P \mapsto \mu_P\) 是单射。两个概率测度 \(P\) 和 \(Q\) 之间的最大均值差异(MMD)定义为它们核均值嵌入之间的RKHS距离:

\[
\mathrm{MMD}^2(P, Q) = \|\mu_P - \mu_Q\|_\mathcal{H}^2. \tag{2}
\]

对于深度编码器 \(f_\theta: \mathcal{X} \to \mathbb{R}^d\),我们采用学习到的核 \(k_\theta(x, y) = \exp\left(-\gamma \|f_\theta(x) - f_\theta(y)\|^2\right)\),这是在特征空间上定义的RBF核。该核的特征映射为 \(\phi_\theta(x) = \exp\left(-\gamma \|f_\theta(x) - \cdot\|^2\right)/2\),被视为在 \(\mathbb{R}^d\) 上的RKHS中的函数。

**测试时自适应协议。** 模型在源分布 \(P_s\) 上预训练;在部署时,它接收从目标分布 \(P_t \neq P_s\) 抽取的无标签批次。我们假设协变量偏移:标签关于特征的条件分布保持不变,\(P_t(y \mid x) = P_s(y \mid x)\),而特征边缘分布发生变化,\(P_t(x) \neq P_s(x)\)。这个假设在域自适应(Ben-David等人,2010)中是标准的,并且在特征与标签之间的语义关系保持稳定但输入分布发生变化时(例如,自动驾驶中的天气变化、医学成像中的风格偏移)是合理的。

对于从模型参数上的后验分布 \(\rho\) 中抽取的随机预测器,在分布 \(P\) 下的期望风险定义为 \(R_P(\rho) = \mathbb{E}_{(x,y) \sim P, w \sim \rho}[\ell(w, x, y)]\),其中 \(\ell(w, x, y)\) 是损失函数(例如,交叉熵)。在协变量偏移下,这分解为

\[
R_P(\rho) = \mathbb{E}_{w \sim \rho}\left[\mathbb{E}_{x \sim P(x)}[L(w, x)]\right], \tag{3}
\]

其中 \(L(w, x) = \mathbb{E}_{y \sim P(y|x)}[\ell(w, x, y)]\) 是条件期望损失。关键在于,由于在协变量偏移下 \(P(y \mid x)\) 保持不变,函数 \(x \mapsto L(w, x)\) 对于 \(P_s\) 和 \(P_t\) 是相同的;只有 \(x\) 上的分布发生变化。

**PAC-贝叶斯框架。** PAC-贝叶斯分析提供了泛化差距 \(R_P(\rho) - \hat{R}_P(\rho)\) 的界,其中 \(\hat{R}_P(\rho) = \mathbb{E}_{w \sim \rho}[\hat{R}_P(w)]\) 是后验平均的经验风险。控制复杂度惩罚项的关键量是后验 \(\rho\) 与固定先验 \(\pi\) 之间的Kullback-Leibler散度 \(\mathrm{KL}(\rho \| \pi) = \mathbb{E}_{w \sim \rho}[\log(\rho(w)/\pi(w))]\)。经典的PAC-贝叶斯定理(McAllester,1999;Germain等人,2016)指出,对于来自 \(P\) 的i.i.d.样本,以概率至少 \(1 - \delta\):

\[
R_P(\rho) \leq \hat{R}_P(\rho) + \sqrt{\frac{\mathrm{KL}(\rho \| \pi) + \log(2\sqrt{n}/\delta)}{2n}}. \tag{4}
\]

我们的贡献通过添加一个依赖于MMD的项来扩展此框架,该项考虑了 \(P_s\) 与 \(P_t\) 之间的分布偏移。

## 4 带有MMD的PAC-贝叶斯界

###### 假设1 (RKHS-利普希茨损失).

对于 \(\rho\) 支撑集中的每个 \(w\),条件期望损失函数 \(L(w, \cdot)\) 属于RKHS \(\mathcal{H}\) 且具有有界范数:\(L(w, \cdot) \in \mathcal{H}\) 且 \(\|L(w, \cdot)\|_\mathcal{H} \leq L_\mathcal{H}\)。

此假设要求条件期望损失(作为输入 \(x\) 的函数)位于由核 \(k\) 诱导的RKHS中。这比单纯的平滑性要求更强——它将 \(L(w, \cdot)\) 的函数形式限制在由核函数张成的希尔伯特空间中。对于具有softmax输出的交叉熵损失,非正式的支持来自softmax函数的平滑性(\(\|\nabla \sigma\|_{\mathrm{op}} \leq 1\))与RBF核的通用性(Sriperumbudur等人,2009)相结合,后者可以逼近任何连续函数。我们在附录E中讨论了松弛条件和经验验证策略。

###### 定理1 (带有MMD偏移惩罚项的PAC-贝叶斯界).

在假设1 (https://arxiv.org/html/2605.21783#Thmassumption1) 和协变量偏移下,对于先验 \(\pi\)、后验 \(\rho\) 和失败概率 \(\delta \in (0,1)\),以至少 \(1 - \delta\) 的概率:

\[
R_{P_t}(\rho) \leq \hat{R}_{P_s}(\rho) + \sqrt{\frac{\mathrm{KL}(\rho \| \pi) + \log(2\sqrt{n}/\delta)}{2n}} + L_\mathcal{H} \cdot \mathrm{MMD}(P_s, P_t). \tag{5}
\]

**证明思路。** 证明分为三步。
**步骤1:** 应用经典PAC-贝叶斯定理(方程4 (https://arxiv.org/html/2605.21783#S3.E4))来界定以经验源风险 \(\hat{R}_{P_s}(\rho)\) 加上KL散度复杂度项表示的源风险 \(R_{P_s}(\rho)\),以概率至少 \(1 - \delta/2\)。
**步骤2:** 在假设1 (https://arxiv.org/html/2605.21783#Thmassumption1) 下,通过再生性质和柯西-施瓦茨不等式,将差距 \(|R_{P_t}(\rho) - R_{P_s}(\rho)|\) 界定为 \(L_\mathcal{H} \cdot \mathrm{MMD}(P_s, P_t)\)。
**步骤3:** 通过联合界进行组合。完整证明见附录A。

一个直接的推论是,当偏移为零时(\(\mathrm{MMD}(P_s, P_t) = 0\)),该界恢复为标准PAC-贝叶斯保证。随着偏移增大,该界优雅地退化——它不会崩溃,而是线性变宽,反映了对目标分布日益增长的认知不确定性。

## 5 有限样本分析

定理1 (https://arxiv.org/html/2605.21783

相似文章

物理信息机器学习泛化性的PAC-Bayesian视角

arXiv cs.LG

本文为物理信息机器学习开发了一种PAC-Bayesian框架,为无界损失提供了高概率泛化保证。它提出了一种多任务视角,联合处理数据保真度、偏微分方程残差和边界条件,并引入了一种自界限学习算法。

面向持续测试时自适应的可靠性门控源锚定

arXiv cs.LG

本文提出RMemSafe,一种用于持续测试时自适应的可靠性门控扩展方法,当冻结源的预测熵变高时会减弱源锚定,从而防止源崩溃下的盲目锚定。该方法在CCC基准测试上实现了最先进的错误率降低。

具有随时有效保证的 AI 系统自适应审计

arXiv cs.AI

本文引入了一种统计框架,利用安全随时有效推断(SAVI)技术对 AI 系统进行自适应审计,旨在基于有限数据得出严谨的结论。文章提出了一种“通过赌博进行测试”的方法,以验证模型的鲁棒性,同时在自适应采样过程中控制第一类错误。

使用分布对齐对抗性蒸馏估计黑盒LLM的不确定性

arXiv cs.CL

本文提出了一种分布对齐对抗性蒸馏(DisAAD)方法,该方法使用一个轻量级代理模型,仅以原始模型1%的规模来估计黑盒大语言模型的不确定性,实现了无需内部参数或多次采样的可靠量化。