基于物理信息的条件归一化流用于仅角度的地月空间轨道确定
摘要
本文提出了一种基于物理信息的条件归一化流模型,用于地月环境中的仅角度轨道确定,实现了灵活的后验表示,并为经典算法提供了热启动。
arXiv:2606.30936v1 Announce Type: new
摘要:本研究通过将生成模型扩展到地月环境中的轨道确定问题,推进了生成式轨道动力学。该任务被建模为条件密度估计,旨在从短弧段仅角度观测中推断初始状态的概率分布。在近直线晕轨道的地心扰动观测上训练了一个归一化流,从而实现了灵活且可能多峰的后验表示。给定新的观测数据,对学习到的密度进行采样,生成统计一致且物理信息丰富的状态假设。通过非线性最小二乘最小化对这些估计进行精化,为经典算法提供了有竞争力的热启动。
查看缓存全文
缓存时间: 2026/07/01 05:33
# 物理信息约束的条件归一化流用于仅角度地月空间轨道确定
来源:https://arxiv.org/html/2606.30936
Walther Litteri,Massimiliano Vasile 教授兼主任,斯特拉斯克莱德大学航空航天卓越中心,英国格拉斯哥 G1 1XQ
###### 摘要
本研究通过将生成式建模推广到地月环境中的轨道确定问题,推动了生成式天体动力学的发展。该任务被建模为条件密度估计,旨在从短弧观测期间的仅角度测量中推断初始状态的概率分布。针对近直线晕轨道的扰动地面观测,训练了一个归一化流模型,实现了灵活且可能多模态的后验表示。给定新测量值后,对学习到的密度进行采样,以生成统计一致且符合物理信息的状态假设。这些估计通过非线性最小二乘优化进行精化,为经典算法提供了有竞争力的热启动。
## 1 引言
恢复空间中天体运行轨道的问题,可以说是有史以来最早提出的科学问题之一。随着空间探索的兴起和空间环境的日益利用,该问题也成为工程界的核心,工程界需要可靠的方法从观测数据中估计航天器的状态。这一研究领域被称为轨道确定(OD)。文献进一步根据任务阶段区分了不同的操作场景[14](https://arxiv.org/html/2606.30936#bib.bib7)。特别是,当轨道估计在任务初始阶段(例如发射后或关键恢复阶段后)进行时,该问题被称为初始轨道确定(IOD)。常规OD与IOD的一个关键区别在于先验信息的可用性。在常规OD操作中,可能还有来自先前估计状态或机载仪器提供的测量数据可供使用。当此类信息不可用时,例如新发射的航天器或不合作目标,IOD问题变得更具挑战性。
过去几十年,对地月空间操作的兴趣显著增长。月球南极永久阴影陨石坑中水冰的存在,使月球成为未来科学和商业活动的有吸引力地点[1](https://arxiv.org/html/2606.30936#bib.bib8)。阿尔忒弥斯计划是近期将人类送回月球附近区域的国际努力,载人月球飞越任务阿尔忒弥斯II现已定于2026年4月进行[3](https://arxiv.org/html/2606.30936#bib.bib9)。在最初的阿尔忒弥斯架构中,Gateway月球轨道站被设想为绕地国际空间站的战略对应物,旨在支持随后的月面任务,包括阿尔忒弥斯IV和V。然而,在2026年初宣布的阿尔忒弥斯计划全面重组之后,Gateway的角色和优先级变得相当不确定,当前计划转向更直接和持续的人类月面存在。
与地球轨道任务相比,在地月空间运行带来了若干额外挑战。地月距离远,使得通信和同步复杂化,导致指令发送与接收之间存在显著时间延迟。此外,许多地月轨道固有的动力学不稳定性和混沌行为进一步增加了操作复杂性,降低了允许误差的裕度,要求更高的精度和准确度。地月空间中的轨道确定因缺乏专用全球导航卫星系统(GNSS)支持该区域导航,以及有限的通信机会限制了频繁跟踪测量数据的可用性,而更加复杂。
传统的轨道确定方法通常依赖校正方案,例如在统计框架中最小化非线性均方误差。扩展卡尔曼滤波器(EKF)通过整合动力学知识来提高估计精度。近来,机器学习和统计学习技术已被探索用于通过非线性潜在力模型来建模未建模力,这些模型充当不相关高斯噪声的滤波器[6](https://arxiv.org/html/2606.30936#bib.bib10), [2](https://arxiv.org/html/2606.30936#bib.bib14)。物理信息神经网络(PINNs)是经过额外项训练的神经网络,用于强制执行底层物理定律[16](https://arxiv.org/html/2606.30936#bib.bib12), [17](https://arxiv.org/html/2606.30936#bib.bib13)。在轨道确定的背景下,PINNs已被用于近似地月环境中的轨道传播和测量模型,从而有助于求解逆问题[13](https://arxiv.org/html/2606.30936#bib.bib11)。
生成式人工智能(AI)是指用于建模概率分布并从中采样的深度学习策略。该框架的应用涵盖多个领域,从文本、图像和音频生成[10](https://arxiv.org/html/2606.30936#bib.bib15)。在天体动力学中,新兴的生成式天体动力学领域内,基于变分自编码器的生成方法已成功应用于分析和生成圆型限制性三体问题(CR3BP)中的周期轨道[8](https://arxiv.org/html/2606.30936#bib.bib17), [9](https://arxiv.org/html/2606.30936#bib.bib16),而归一化流模型已被用于识别和表征N体问题中的平衡解[18](https://arxiv.org/html/2606.30936#bib.bib18)。
本研究提出了生成式天体动力学在地月空间轨道确定问题求解中的新颖应用。将对应观测弧的地平状态建模为以仅角度观测为条件的分布。在该分布上训练归一化流模型,并以观测为条件进行采样提供估计状态,然后使用传统方法进一步精化。本文将展示在损失函数中加入基于轨道传播的附加项如何帮助正则化物理损失,从而产生更准确的结果。
论文结构如下。首先,提供问题概述,定义关注量及基本假设。然后进行模型定义,详细说明架构选择、权衡以及物理信息损失的实现。最后,讨论所提方法的性能,包括与传统方法的比较,并给出结论性评价。
## 2 地月轨道确定
### 2.1 场景
Gateway平台的轨道分析考虑周期约7天的近直线晕轨道(NRHO),位于地球-月球圆型限制性三体问题(CR3BP)的第二共线欧拉-拉格朗日点 $L_2$ 附近,特征质量参数 $\mu=0.01215$。以下运动方程(EOM)以无量纲单位表示,并在会合(旋转)参考系 $Oxyz$ 中写出,该系以地月系统质心为中心,$x$ 轴从地球指向月球,$z$ 轴指向角动量方向,$y$ 轴构成右手系[12](https://arxiv.org/html/2606.30936#bib.bib19):
$$
\begin{aligned}
\ddot{x} &= 2\dot{y} + U_x, \quad &(1a)\\
\ddot{y} &= -2\dot{x} + U_y, \quad &(1b)\\
\ddot{z} &= U_z. \quad &(1c)
\end{aligned}
$$
状态向量 $\mathbf{x} = [x, y, z, \dot{x}, \dot{y}, \dot{z}]^T \in \mathbb{R}^6$ 依次收集了非惯性会合系中无质量粒子相对于系统质心的位置和速度分量。量 $U_x, U_y, U_z$ 表示伪势函数 $U(x,y,z)$ 关于位置坐标的梯度分量:
$$
U(x,y,z) = \frac{1}{2}(x^2+y^2) + \frac{1-\mu}{r_1} + \frac{\mu}{r_2} + \frac{1}{2}\mu(1-\mu). \quad (2)
$$
粒子与两个主天体之间的标量距离分别为 $r_1$ 和 $r_2$:
$$
r_1 = \sqrt{(x+\mu)^2 + y^2 + z^2}, \quad r_2 = \sqrt{(x-(1-\mu))^2 + y^2 + z^2}.
$$
图1展示了属于 $L_2$-NRHO 族的十条轨迹。这些轨道通过数值积分运动方程(1)在一个轨道周期上得到,该周期在名义7天周期约±1小时内变化。
(a) 会合参考系。红星表示欧拉-拉格朗日点 $L_1, L_2$,蓝星表示月球
(b) 地心惯性参考系。红线表示月球在一个恒星月内的轨道
图1:属于 $L_2$-NRHO 族的10条轨道,传播1个恒星月周期
在图1(a)中,轨迹在会合参考系中描绘,而在图1(b)中,相同轨道在地心惯性参考系(ECI)中表示,记为 $O_{\mathrm{XYZ}}$。会合系中表达的状态向量 $\mathbf{x}$ 与地心惯性系中相应状态 $\mathbf{X}$ 之间的变换由下式给出:
$$
\mathbf{X} = \begin{bmatrix} \boldsymbol{\Omega}(t) & \mathbf{0}_{3\times 3} \\ \mathbf{0}_{3\times 3} & \boldsymbol{\Omega}(t) \end{bmatrix} \left( \mathbf{Lx} + \mathbf{x}_{\mathrm{C}} - \mathbf{x}_{\mathrm{E}} \right). \quad (3)
$$
矩阵 $\mathbf{L}$ 执行会合状态的量纲化,使用特征长度($LU$)和速度($LU/TU$)单位。向量 $\mathbf{x}_{\mathrm{C}}$ 表示与旋转系相关的科里奥利贡献,角速度向量为 $\boldsymbol{\omega}_s = [0,0,\omega_s]^T, \omega_s = 1/TU$,而 $\mathbf{x}_{\mathrm{E}}$ 表示地球在会合系中的状态:
$$
\mathbf{x}_{\mathrm{C}} = LU \begin{bmatrix} \mathbf{0}_3 \\ \boldsymbol{\omega}_s \times [x,y,z]^T \end{bmatrix}, \quad \mathbf{x}_{\mathrm{E}} = LU \begin{bmatrix} [-\mu,0,0]^T \\ \boldsymbol{\omega}_s \times [-\mu,0,0]^T \end{bmatrix}.
$$
随时间变化的旋转矩阵 $\boldsymbol{\Omega}(t) \in \mathbb{R}^{3\times 3}$ 将向量从会合系映射到ECI系。它根据经典欧拉33-11-33旋转序列构建,参数由参考历元 $t_0$ 处的月球轨道根数给出:
$$
\boldsymbol{\Omega}(t) = \boldsymbol{\Omega}_3(\Omega_0) \boldsymbol{\Omega}_1(i_0) \boldsymbol{\Omega}_3(\omega_0 + \nu_0 + \omega_s t). \quad (4)
$$
角度 $\Omega_0, i_0, \omega_0, \nu_0$ 分别表示参考历元 $t_0$ 处月球的升交点赤经、倾角、近地点角距和真近点角,由星历数据获得。为便于参考,以下矩阵定义了绕轴1(记为 $\boldsymbol{\Omega}_1$)和轴3(记为 $\boldsymbol{\Omega}_3$)的基本旋转,角度为 $\alpha$。项 $c$ 和 $s$ 分别表示三角函数 $\cos\alpha, \sin\alpha$。
$$
\boldsymbol{\Omega}_1(\alpha) = \begin{bmatrix} 1 & 0 & 0 \\ 0 & c & -s \\ 0 & s & 1 \end{bmatrix}, \quad \boldsymbol{\Omega}_3(\alpha) = \begin{bmatrix} c & -s & 0 \\ s & c & 0 \\ 0 & 0 & 1 \end{bmatrix}.
$$
时刻 $t \geq 0$ 是相对于参考时刻 $t_0$ 定义的,即 $t=0$ 对应实际的(物理)时间 $t_0$。
表1:轨道确定问题的参考量
最后,表1报告了本章定义并在后续工作中使用的参考单位。
### 2.2 仅角度观测量
考虑图2所示的轨道确定问题。观测者位于地球表面某位置,相对于地心系 $O_{XYZ}$ 的位置向量为 $\mathbf{R}_o$。观测弧由观测量集合 $\{\mathbf{y}_i\}_{i=1}^N$ 给出,其中 $N$ 是在相继时刻 $t_i$ ($i=1,2,\ldots,N$) 进行的观测次数。这些观测量源自观测者的顶心位置。轨道确定问题的目标是恢复目标物体在观测弧起始时刻(即 $t=t_1$)的地心状态 $\mathbf{X}_1 \in \mathbb{R}^6$。设属于观测弧的地心状态 $\mathbf{X}_i$ 及其速度分量分别为 $\mathbf{R}_i$ 和 $\mathbf{V}_i$:
$$
\mathbf{X}_i = \begin{bmatrix} \mathbf{R}_i \\ \mathbf{V}_i \end{bmatrix}, \quad i=1,2,\ldots,N.
$$
视线向量 $\boldsymbol{\rho}_i$ 定义为目标位置向量与观测者位置向量之差,在同一地心参考系中:
$$
\boldsymbol{\rho}_i = \mathbf{R}_i - \mathbf{R}_o. \quad (5)
$$
本研究考虑的观测量是仅角度测量,即方位角和仰角,分别记为 $\theta_i$ 和 $\varphi_i$:
$$
\mathbf{y}_i = \begin{bmatrix} \theta_i \\ \varphi_i \end{bmatrix}, \quad i=1,\ldots,N.
$$
这些量描述了 $\boldsymbol{\rho}_i$ 在以观测者为中心的本地顶心坐标系中的方向。设 $(X_i, Y_i, Z_i)$ 表示 $\boldsymbol{\rho}_i$ 在该本地系中的分量。则历元 $t_i$ 处的测量方程由下式给出:
$$
\begin{aligned}
\theta_i &= \arctan\left(\frac{Y_i}{X_i}\right) + \varepsilon_\theta, \quad &(6)\\
\varphi_i &= \arcsin\left(\frac{Z_i}{\|\boldsymbol{\rho}_i\|_2}\right) + \varepsilon_\varphi. \quad &(7)
\end{aligned}
$$
图2:轨道确定问题示意图相似文章
基于条件归一化流的不确定性感知多保真度闭合模型
本文提出了一种基于条件归一化流的不确定性感知多保真度框架,用于改进复杂多尺度系统的降阶模型(ROM)的预测准确性。该方法学习从低保真度到高保真度系数的概率映射,并在涡旋合并问题上进行了验证,展示了改进的准确性和不确定性量化。
基于超球面流的语言建模
本文介绍了 S-FLM,一种新颖的基于流的语言模型。该模型在超球面潜在空间中运行,旨在解决现有离散扩散模型和连续流模型的计算成本高昂及语义表达受限等问题。
面向物理系统群体动力学学习的双参数流
提出了双参数流方法,从无标签样本学习高维概率密度的动力学,利用条件流匹配提取物理时间速度场。
基于归一化流的潜在推理
提出NF-CoT,一种使用归一化流来建模LLMs中连续思维的潜在推理框架,保留了自回归优势,并以更低的成本实现了更好的代码生成性能。
通过不动点流的自条件化流映射语言模型
介绍了不动点流,一种自条件化流语言模型,将自条件化视为不动点迭代,从而能够蒸馏出几步流映射语言模型 (FMLM⋆),在OpenWebText上优于先前工作。