守恒定律何时能在学习到的表示中存续？潜在世界模型的可认证时域

arXiv cs.LG 2026/06/25 04:00 论文

摘要

本文研究了在学习到的潜在世界模型中如何认证守恒定律，提出了有界时域，通过可测量的模型缺陷可提前保证轨迹在物理不变水平集上保持多少步。

arXiv:2606.24945v1 公告类型：新摘要：我们提出了一个关于物理世界模型的表示学习问题：当模型学习到潜在表示时，守恒定律何时仍可被认证？可认证时域从可测量的模型缺陷出发，预先界定了展开轨迹能证明停留在物理不变量的水平集上的步数。关键的设计选择在于什么被认证：不是学习到的潜在Hamiltonian或学习到的标量见证（模型可以在真实能量漂移的同时守恒这两者），而是通过解码潜在状态并评估已知不变量得到的解码后的物理不变量。围绕这一对象，我们推导了壳时域证书，其预算分解为表示、读出和潜在动力学缺陷，并通过一个单调对齐桥梁，使得软学习到的见证能为解码后的不变量提供可认证时域。我们在保守系统上对状态、学习提升和像素观测进行了测试。守恒证书可以在学习到的表示中存续，但并非所有几何先验都能同等存续：硬典型辛结构在已知相坐标中产生最长的时域，但无法跨越学习到的图表，而受控Lipschitz对齐的软不变量在我们测试的学习表示设置中存续；像素认证在读出稳定的子管上恢复；Kepler问题暴露了几何边界。因此，核心对象不是潜在Hamiltonian，而是解码后的物理不变量，其对表示学习的鲁棒性可以被测量、认证和证伪。

查看原文

查看缓存全文

缓存时间: 2026/06/25 05:07

# 守恒律何时能在学习到的表征中存续？潜在世界模型的经认证时域
来源：https://arxiv.org/html/2606.24945
\setmainfont

texgyretermes[Path=./, Extension=.otf, UprightFont=*-regular, BoldFont=*-bold, ItalicFont=*-italic, BoldItalicFont=*-bolditalic]\setmathfont{texgyretermes-math.otf}[Path=./]

###### 摘要

我们提出一个关于物理世界模型的表征学习问题：当模型学习到一个潜在表征后，一个守恒律何时能保持“可认证”状态？一个经认证的时域——基于可测量的模型缺陷，预先给出界限——是指在多少步推演内，可以证明模型停留在某个物理不变量的水平集上。关键的设计选择在于“什么”被认证：不是学习到的潜在哈密顿量，也不是学习到的标量证据（模型可以在保持自身的同时让真实能量漂移），而是**解码后的物理不变量**——通过解码潜在状态并评估已知的不变量得到。围绕这个对象，我们推导出壳层时域认证，其预算分解为表征、读取和潜在动力学缺陷，并通过一个单调的“对齐桥梁”将软性学习到的证据与解码后不变量的经认证时域联系起来；我们在保守系统的状态、学习到的提升和像素观测上进行了测试。守恒认证**可以**在学习到的表征中存续，但并非所有几何先验都能同样存活：硬性正则辛结构在已知相坐标下能产生最长的时域，却无法跨越学习到的坐标映射；而通过受控利普希茨对齐的软性不变量，在我们测试的学习表征设置中却能存活；像素认证在读取稳定的子管上得以恢复；开普勒问题则揭示了一个几何边界。因此，核心对象并不是一个潜在哈密顿量，而是一个解码后的物理不变量，其对表征学习的鲁棒性可以被测量、认证和证伪。

### 1. 引言

一个世界模型只有能够说出“何时停止信任自己”时才是可部署的，而现代世界模型之所以能获得优势，恰恰因为它们根本不依赖观测空间进行预测：它们学习一个潜在表征并在其中向前推演。这正使得信任问题变得微妙。对于物理系统，信任有一种天然的衡量标准——守恒量：如果一次推演在 \(n\) 步后偏离能壳，那么 \(n\) 就是一个具体、可检验的时域。但守恒是关于“物理”坐标的陈述，而一个潜在世界模型，顾名思义，已经用学习到的坐标替换了那些坐标。因此，本文的问题是一个表征学习问题：“当模型学习到一个潜在表征后，一个守恒律何时能保持可认证状态”——即能够从可测量的模型缺陷中预先给出界限，而不仅仅是事后观察到？

两个事实使这个问题变得非平凡。第一，学习动力学的既有保证主要是“逐点且谱”的——它们通过雅可比矩阵或库普曼谱来限制单步误差增长，因此呈几何级数衰减，并认证轨迹的“分离”速度，而非一个守恒“结构”能否在多步中维持。守恒提供了一种不同的、更慢的衡量方式：谱时域限制轨迹发散的速度（衰减如 \(\log(1/\epsilon)/\lambda\)），而守恒时域限制一个守恒标量保持不动的时间——通常长得多。第二，这也是关键所在，当模型变为潜在时，必须决定“什么”被守恒。学习到的潜在哈密顿量 \(H_\theta\) 和学习到的标量证据 \(C_\omega\) 虽方便且架构自然，但两者都不是物理不变量：模型可以完美地保持自身内部标量，而真实能量却在漂移。表征学习不仅使认证复杂化，它还创造了一个关于“证书最初附着于什么”的对象问题。潜在世界模型可能“保持”某物，但除非该物与解码后的物理不变量对齐，否则它就不是一个证书。

我们的答案将认证对象固定为解码后的物理不变量 \(H^\star(\Pi D_\psi z)\)：解码潜在状态 (\(D_\psi\))，读取物理坐标 (\(\Pi\))，并评估“已知”的物理不变量 \(H^\star\)。具体而言，对于以像素观测的摆，\(H^\star\) 是真实的机械能：模型在训练或推演过程中从未接收到它，我们仅在解码潜在状态并读取 \((q,p)\) 之后才对其进行评估——因此证书衡量的是“物理”能量（而非模型内部替代物）是否保持在壳上。图 1 将此作为论文的主干——\(H_\theta\) 和 \(C_\omega\) 是侧支上的证据/代理，没有通向认证对象的路径；证书仅在状态流水线与潜在-解码流水线汇合于 \(H^\star(\Pi D_\psi z)\) 处进行评估。那么，以下所有主张都基于两条原则：认证对象“始终”是解码后的物理不变量，而每一次成功或失败都诚实地沿着状态→提升→像素的阶梯（表征距离物理坐标越远）来归因。

证书在解码后的物理不变量 \(\hat{H}^\star(\Pi D_\psi z)\) 上进行评估，状态流水线与潜在-解码流水线在此汇合——而不是学习到的潜在哈密顿量 \(H_\theta\) 或证据 \(C_\omega\)，后者被绘制为一个降级的侧支，没有通向认证对象的路径。
**图 1：** 证书在解码后的物理不变量 \(H^\star(\Pi D_\psi z)\) 上进行评估，状态流水线与潜在-解码流水线在此汇合——而不是学习到的潜在哈密顿量 \(H_\theta\) 或证据 \(C_\omega\)，后者被绘制为一个降级的侧支，没有通向认证对象的路径。

固定了对象之后，科学内容便成为一个关于“表征鲁棒性”的问题：哪些结构先验能让守恒证书在从物理状态迁移到学习到的坐标映射时存活？我们一次性陈述论点：**“与守恒对齐的证书可以在学习到的表征中存续，但并非所有几何先验都能同样存活。”** 硬性正则辛结构——哈密顿世界模型的默认归纳偏差——在已知相坐标下有效，但不会自动跨越学习到的坐标映射，因为辛性约束的是流的“形式”（它保持一个辛形式），而非“哪个”标量等于物理能量。一个“软性”学习到的不变量，在潜在空间中训练为守恒，然后通过一个受控利普希茨桥与物理能量“对齐”，对于恰好击败硬性先验的表征变化更为鲁棒。像素观测增加了一个正交的“感知”瓶颈——解码器/读取器位于潜在坐标与物理坐标之间——而一个奇异系统（开普勒二体问题）暴露了联合不变性认证的纯几何极限。实际解读是条件性的，而非全盘否定：在潜在辛形式即为物理形式的坐标中进行认证，或将硬性结构与守恒标量的显式对齐配对——否则，一旦坐标映射被学习，先验保护的只是一个从 \(H^\star\) 漂移开的“影子”量。

我们在保守系统（摆、谐振子、开普勒二体）的三种表征上进行了测试，保持认证对象固定，仅改变模型所看到的内容。四个发现，详细归因于 §5：(i) 在已知正则状态下，硬性辛结构是明确的赢家——在开普勒问题上，联合不变量壳在 \(3/3\) 个种子上非空（对于辛模型）对比 \(0/3\)（对于普通模型），单步不变量漂移约小 \(\sim 7.6\times\)；(ii) 在学习到的提升下，硬性先验退化为无约束基线，而软性不变量存活，结构增益比 \(\approx 1.30\)，且 \(P(\text{soft} > \text{plain}) = 0.88\)（八个种子）；(iii) 在像素下，稳定的软性证据在“读取稳定子管”上恢复了非空的解码能量证书——在 \(\epsilon = 2.0\) 时，胜出普通模型于 \(8/10\) 个种子，在 \(9/10\) 个种子上非空（普通模型 \(4/10\)），在 \(10/10\) 个种子上对齐为正，被排除部分 \(\leq 2.3\%\)；(iv) 开普勒“提升”触及了一个内在的近近日点刚度下限，该下限在容量扩展和我们尝试的所有合法度量重新映射下均保持不变——这是一个带有机制解释的干净否定结果，而非结构失败。

**贡献。** 1. **守恒证书的表征鲁棒性框架。** 我们将认证对象固定为解码后的物理不变量 \(H^\star(\Pi D_\psi z)\)——而非 \(H_\theta\) 或 \(C_\omega\)——并研究基于它的证书何时能在学习到的坐标映射中存活（图 1；§3–4）。2. **证书理论**（§3）：一个统一的解码不变量时域界限族——一个状态壳、一个显式三路误差预算的潜在解码能量壳、一个将软性证据桥接到认证解码不变量的受控利普希茨“对齐桥梁”，以及一个向量联合不变量壳。3. **学习到表征下的硬性 vs 软性存续结果**（§5）：硬性辛在正则坐标中胜出（\(3/3\) vs \(0/3\)），但在学习到的提升下崩溃，而受控利普希茨对齐的软性不变量存续（\(\approx 1.30\)，\(P = 0.88\)）；**仅单调性不足**。4. **两个诚实的表征极限结果**：仅在读取稳定子管上恢复的像素证书（排除部分 \(\leq 2.3\%\)），以及一个对容量和合法重新映射鲁棒的开普勒提升几何边界。

### 2. 相关工作

以下四条脉络各自为“学习”动力学提供了有用的结构；我们的贡献是正交的——我们问的是，在编码和解码之后，哪个物理不变量实际上被“认证”，以及硬性与软性守恒先验在学习到的表征下表现如何。（我们并不声称先前的研究忽略了守恒，辛模型毫无用处，或者我们是第一个使用不变量的。）

**结构保持与不变量学习。** 两条相关脉络将守恒构建到学习到的动力学中。哈密顿/辛模型强加相空间结构：哈密顿神经网络 [Greydanus et al., 2019 (https://arxiv.org/html/2606.24945#bib.bib4)]、哈密顿生成网络 [Toth et al., 2020 (https://arxiv.org/html/2606.24945#bib.bib11)]（从图像推断潜在相空间）、SympNets [Jin et al., 2020 (https://arxiv.org/html/2606.24945#bib.bib6)]，以及几何数值积分 / 后向误差传统 [Hairer et al., 2006 (https://arxiv.org/html/2606.24945#bib.bib5), Reich, 1999 (https://arxiv.org/html/2606.24945#bib.bib9)]（解释辛积分器的长时能量行为）。第二条脉络直接学习不变量：元学习守恒量 [Alet et al., 2021 (https://arxiv.org/html/2606.24945#bib.bib1)]、数据驱动的守恒律发现 [Kaiser et al., 2018 (https://arxiv.org/html/2606.24945#bib.bib7)]，以及库普曼算子方法（其单位特征值的特征函数表达守恒可观测量）[Lusch et al., 2018 (https://arxiv.org/html/2606.24945#bib.bib8)]——我们的软性“B-自”证据 \(C_\omega\) 属于此类。**区别。** 这些方法学习或强加结构以改进“模型”；它们不问当模型操作于学习到的表征时“什么”被认证。我们的认证对象是解码后的物理不变量 \(H^\star(\Pi D_\psi z)\)，而非 \(H_\theta\) 或学习到的证据；并且，学习到的不变量是一个“证据”，除非通过双利普希茨桥（§3.3）与解码后的不变量对齐，否则不是证书——仅单调性是不够的。（HGN 是最接近的结构模板；我们将“从像素学习潜在相空间”视为已建立的先验技术。）

**等变 / 几何深度学习。** 第二条脉络通过等变网络强加对称性 [Satorras et al., 2021 (https://arxiv.org/html/2606.24945#bib.bib10), Cohen and Welling, 2016 (https://arxiv.org/html/2606.24945#bib.bib3)]。**区别。** 我们的焦点不是一般的等变性，而是在学习到的潜在表征下与守恒对齐的“证书对象”；等变性约束一个表征如何变换，而我们问的是，在编码/解码之后，哪个解码后的物理不变量允许有时域证书。（一个单独的时空等变世界模型方向相关但非核心；此线仅为定位。）

**经认证 / 长时域世界模型。** 第三条脉络限制学习到的模型能被信任多远：谱和里亚普诺夫风格的证书限制单步误差增长；共形和可达性方法校准预测集或安全管 [Angelopoulos and Bates, 2021 (https://arxiv.org/html/2606.24945#bib.bib2)]；近期一条脉络为等变世界模型建立了谱经认证时域 \(T_j(\epsilon) \sim \log(1/\epsilon)/\lambda_j\) [Wang, 2026 (https://arxiv.org/html/2606.24945#bib.bib12)]。**区别。** 现有证书主要是“逐点/谱”的，且呈几何级数衰减；本文构建了与守恒对齐的时域，绑定于一个解码后的物理不变量，其预算是每步不变量漂移，而非雅可比谱（谱线是互补的 \(T_{\rm state}^{\rm spec}\) 基线）。

> **定位。** 新颖之处不在于“使用哈密顿先验”；而在于通过学习到的表征认证解码后的物理不变量，并展示硬性正则辛结构对坐标敏感（在已知相坐标中胜出，但不会自动跨越学习到的坐标映射），而受控利普希茨对齐的软性不变量却能存活。

### 3. 与守恒对齐的证书

#### 3.1 设置

令 \(H^\star\) 为一个连续系统的已知物理不变量，\(\Sigma_c = \{x : H^\star(x) = c\}\) 为一个能壳，\(K_{c,\rho}\) 为其周围的管状邻域。证书是模型步骤的最大数量，使得一次推演被证明保持在壳的容差 \(\epsilon\) 之内。以下每个界限都具有相同的形状——一个容差预算 \(m_{c,\rho}\,\epsilon\) 减去初始化缺陷，再除以每步漂移——不同之处仅在于当表征变得更加抽象时，“哪些”缺陷会进入表达式。我们定义 \(m_{c,\rho} = \inf_{x \in K_{c,\rho}} \lVert \nabla H^\star(x) \rVert > 0\) 为壳的灵敏度，并使用 \(\lfloor\cdot\rfloor\) 表示时域为整数步数。

#### 3.2 状态与潜在解码能量壳（命题 A、B）

**命题 A（状态壳）。** 设单步状态缺陷 \(\delta_{\rm state} = \sup_{K} |H^\star(f_\theta x) - H^\star(x)|\) 和初始化缺陷 \(\epsilon_0^{\rm state}\)，通过望远镜求和及中值定理可得 \(|H^\star(x_n) - H^\star(x_0)| \le n \, \delta_{\rm state}\)，因此

\[
T_{\rm shell}^{\rm state} = \left\lfloor \frac{m_{c,\rho}\,\epsilon - \epsilon_0^{\rm state}}{\delta_{\rm state}} \right\rfloor.
\]

**命题 B（潜在解码能量壳）。** 对于 \(\hat{x}_n = \Pi D_\psi F_\theta^{\,n} E_\phi(o_0)\)，设管解码能量漂移 \(\delta_{\rm phys}^{\rm tube} = \sup_{z \in K_z} |H^\star(\Pi D_\psi F_\theta z) - H^\star(\Pi D_\psi z)|\) 和初始解码缺陷 \(\epsilon_0 = |H^\star(\Pi D_\psi E_\phi o_0) - c|\)，则

\[
T_{\rm shell}^{\rm latent} = \left\lfloor \frac{m_{c,\rho}\,\epsilon - \epsilon_0}{\delta_{\rm phys}^{\rm tube}} \right\rfloor.
\]

其中 \(\delta_{\rm phys}^{\rm tube}\) 可进一步分解为表征缺陷、读取缺陷和潜在动力学缺陷，具体分解方式取决于模型结构。

#### 3.3 对齐桥梁（命题 C）

为了将软性学习到的证据 \(C_\omega\) 与解码后的物理不变量连接起来，我们引入一个对齐桥梁。设 \(C_\omega\) 在潜在空间中被训练为守恒，且存在一个函数 \(g\) 使得 \(H^\star(\Pi D_\psi z) \approx g(C_\omega(z))\)。如果 \(g\) 是受控利普希茨的（即存在常数 \(L\) 使得 \(|g(a) - g(b)| \le L|a - b|\)），则潜在空间中的守恒意味着解码后物理不变量上的有界漂移。具体地，若对于所有潜在状态 \(z\) 有 \(|C_\omega(F_\theta z) - C_\omega(z)| \le \delta_{\rm latent}^{\rm cons}\)，则

\[
|H^\star(\Pi D_\psi F_\theta z) - H^\star(\Pi D_\psi z)| \le L\, \delta_{\rm latent}^{\rm cons} + \text{对齐误差}.
\]

通过对齐桥梁，我们可以将软性证据的时域转换为解码后物理不变量的时域。注意，仅单调性（如 \(g\) 单调）不足以保证该转换；需要利普希茨连续性来控制漂移的放大。（更多细节见附录。）

#### 3.4 向量联合不变量壳（命题 D）

对于具有多个守恒量的系统（如哈密顿量和角动量），我们可以考虑向量值不变量 \(\mathbf{H}^\star = (H_1^\star, \ldots, H_k^\star)\) 及其壳 \(\Sigma_{\mathbf{c}} = \{x : \mathbf{H}^\star(x) = \mathbf{c}\}\)。此时，容差预算变为向量范数下的条件，且灵敏度由雅可比矩阵的奇异值下界给出。联合不变量壳的时域为

\[
T_{\rm joint} = \left\lfloor \frac{\mu_{\mathbf{c},\rho}\, \epsilon - \epsilon_0}{\delta_{\rm joint}} \right\rfloor,
\]

其中 \(\mu_{\mathbf{c},\rho} = \inf_{x \in K_{\mathbf{c},\rho}} \sigma_{\min}(\nabla \mathbf{H}^\star(x)) > 0\)，\(\sigma_{\min}\) 表示最小奇异值，\(\delta_{\rm joint}\) 是向量值不变量在一步中的最大漂移范数。

### 4. 实验设置

我们在三个保守系统（摆、谐振子、开普勒二体）和三种观测模态（状态、学习到的提升、像素）上测试证书。对于每个系统，我们固定已知物理不变量 \(H^\star\)（能量，对于开普勒还包含角动量），并训练多个模型（普通前馈、辛结构、软性不变量）。证书时域在推演过程中计算，基于解码后的状态与真实不变量的偏离。我们报告不同容差 \(\epsilon\) 下的时域，并比较硬性先验（辛）与软性先验（对齐证据）的表现。关键指标包括非空时域的比例、平均时域长度，以及每步漂移的放大倍数。

### 5. 结果与分析

#### 5.1 已知正则状态

在已知正则坐标下，硬性辛结构在所有系统上均产生最长时域。对于开普勒，联合不变量壳在 \(3/3\) 个种子上非空（辛模型），而普通模型在 \(0/3\) 上非空。辛模型的每步不变量漂移平均比普通模型小约 \(7.6\) 倍。

#### 5.2 学习到的提升

当模型从观测中学习一个潜在提升时，硬性辛先验的表现下降至与无约束基线相当。相比之下，受控利普希茨对齐的软性不变量存活，结构增益比（软性 vs 普通）约为 \(1.30\)，且 \(P(\text{soft} > \text{plain}) = 0.88\)（基于八个种子）。这一结果证实了硬性先验的坐标敏感性：在未知坐标映射下，辛结构保护的是一个形式而非具体的物理标量。

#### 5.3 像素观测

在像素观测下，我们发现在读取稳定子管（即解码器输出稳定、无剧烈跳变的轨迹段）上，软性证据能够恢复非空的解码能量证书。在 \(\epsilon = 2.0\) 时，软性模型在 \(8/10\) 个种子上优于普通模型，在 \(9/10\) 个种子上非空（普通模型 \(4/10\)），且对齐为正的比例为 \(10/10\)。被排除的轨迹段占总长度的比例 \(\leq 2.3\%\)。

#### 5.4 开普勒问题的几何边界

开普勒系统在学习到的提升下，无论容量如何扩展，或采用何种合法度量重新映射，均无法提高证书时域。这一现象源于近近日点附近的刚度：能量与角动量的联合梯度在此处接近奇异，导致灵敏度 \(\mu_{\mathbf{c},\rho}\) 极小。这是一个带有清晰机制解释的几何限制，而非结构失败。

### 6. 讨论与结论

本文表明，守恒证书可以在学习到的表征中存续，但前提是选择正确的认证对象——即解码后的物理不变量，而非潜在哈密顿量或学习到的证据。硬性辛结构在已知坐标中强大，但无法自动适应学习到的坐标映射；软性、对齐的不变量则更具鲁棒性，尽管需要额外的利普希茨约束。像素观测引入了一个读取瓶颈，但通过子管过滤可以恢复部分证书。开普勒问题则揭示了一个不可规避的几何极限。

未来的工作可以探索更复杂的对齐机制、适应读取瓶颈的架构设计，以及将本框架推广到部分可观测和随机系统。我们的核心信息是：表征学习改变了守恒证书的附着点，但通过关注解码后的物理不变量，我们仍然可以测量、认证并诚实地报告其极限。

守恒定律何时能在学习到的表示中存续？潜在世界模型的可认证时域

相似文章

等变世界模型的共形轨道有效信任地平线

用于守恒律的稳健基础模型：通过循环视觉转换器将上下文注入通量神经算子

为何通用人工智能需要世界模型：大型语言模型的不足与世界模型的潜在优势

以人为中心的学习机制：熵正则化表示学习的动态框架

@dair_ai: 一个LLM代理真的能构建它无法看到的环境模型吗？这项工作使这个问题可评分。一个代理…

提交意见反馈