利用图学习辅助混合组合优化的空间碎片捕获主动系绳网系统设计

arXiv cs.LG 2026/05/29 04:00 论文

摘要

本文提出了一种图学习辅助的优化方法，用于设计捕获空间碎片的主动系绳网系统。通过使用图神经网络推荐候选设计方案，将混合组合非线性规划简化为标准非线性规划问题，从而加快收敛速度。

arXiv:2605.29021v1 公告类型：新摘要：主动系绳网系统通过部署由可操控单元（MUs）操纵的柔性网，是捕获大型非合作目标（如空间碎片）的一种有前景的解决方案。然而，同时系统地探索系绳网系统的设计与控制选择以充分了解其潜力仍受到限制，部分原因是其涉及复杂的、带约束的非线性优化问题——该问题包含连续变量、整数变量和分类变量，其中后两者分别来自网连接性和组件选择。经典的二进制编码方法通常难以有效解决工程设计中高度非线性和多模态的混合组合非线性规划问题，而整数编码方法可能会在组合之间引入虚假关系。鉴于组合空间的图结构特性，本文采用并扩展了一种新的图学习辅助优化方法来解决该混合组合非线性规划问题。具体而言，训练一个图神经网络（GNN），以候选设计方案（表示为图中的节点）作为输入，输出得分并据此推荐候选组合，同时将候选设计中的连续变量向量部分作为输入。由此，混合组合非线性规划优化简化为标准非线性规划问题，可使用标准求解器求解。虽然这种简化方法与非线性规划求解器的选择无关，但本文采用最先进的粒子群优化算法结合基于梯度的微调作为求解器。在同时设计网形态、可操控单元的质量和推进器选择以及系绳网系统控制器使用的瞄准点的问题上，基于图神经网络的推荐器被证明相比直接求解混合组合非线性规划问题，能够显著更快地收敛到类似的优化解。

查看原文

查看缓存全文

缓存时间: 2026/05/29 09:15

# 基于图学习辅助混合组合优化的空间碎片捕获主动绳网系统设计
来源：https://arxiv.org/html/2605.29021
冯柳1Achira Boonrath1,∗∗同等贡献Gishnu Madhu2,∗Eleonora M\. Botta32计算机科学与工程系硕士生3机械与航空航天工程系副教授，AIAA成员Souma Chowdhury44机械与航空航天工程系教授；计算机科学与工程系（兼任）教授，AIAA高级会员，通讯作者本文已被2026年AIAA航空论坛收录。

###### 摘要

主动绳网系统为捕获具有不确定动力学特性的大型非合作目标（包括空间碎片）提供了一种有前景的解决方案。该系统涉及从追踪航天器部署一张柔性网，并利用可机动单元（MU）操控网的轨迹。然而，同时系统性地探索绳网系统的设计和控制选择以理解其全部潜力的研究仍然有限，部分原因是该问题呈现出一个复杂、受约束的非线性优化问题——它混合了连续变量、整数变量和类别变量，后两者分别源于网的连接性和组件选择。经典组合优化范式中的二进制编码方法不太适合解决工程设计领域的此类混合组合非线性规划（MCNLP）问题，因为这里存在高度非线性且通常多模态的函数。另一方面，整数编码方法会在组合之间引入虚假关系。鉴于组合空间的图结构特性，本文采用并扩展了一种新的图学习辅助优化方法来解决这个MCNLP问题。在此，训练一个图神经网络（GNN）来对候选组合进行评分（作为输出），并据此推荐由图中节点表示的候选组合，而候选设计的连续变量向量部分则作为输入。结果是，MCNLP优化简化为一个NLP问题，可以使用标准求解器求解。虽然这种简化方法与NLP求解器的选择无关，但本文使用了最先进的粒子群优化（PSO）算法配合基于梯度的微调作为求解器。在同时设计网的形态、MU的质量和推进器选择以及绳网系统控制器使用的瞄准点的问题上，基于GNN的推荐器被证明能够提供比直接求解MCNLP问题快得多的收敛速度，并得到相似的优化解。

## I 引言

空间碎片对地球轨道上的太空任务构成了日益严重的风险[1 (https://arxiv.org/html/2605.29021#bib.bib141)]。解决该问题的方法属于主动碎片移除（ADR）范畴，可以通过多种方式实现，其中绳网系统尤其有前景，因为它能够捕获非合作且翻滚的大型碎片，同时保持追踪卫星处于安全距离[25 (https://arxiv.org/html/2605.29021#bib.bib283),2 (https://arxiv.org/html/2605.29021#bib.bib149),12 (https://arxiv.org/html/2605.29021#bib.bib117),13 (https://arxiv.org/html/2605.29021#bib.bib258)]。为了提高空间碎片捕获任务的鲁棒性（例如，提高捕获成功率），近年来提出了使用主动式机器人绳网系统的想法[20 (https://arxiv.org/html/2605.29021#bib.bib263),37 (https://arxiv.org/html/2605.29021#bib.bib108),17 (https://arxiv.org/html/2605.29021#bib.bib170),3 (https://arxiv.org/html/2605.29021#bib.bib99),38 (https://arxiv.org/html/2605.29021#bib.bib254)]。此类系统在网的角部或边缘上附有多个可机动单元，其推进器可以将网运送到碎片处。在捕获碎片后，追踪航天器启动离轨或迁移过程，将其运送到墓地轨道。文献中考虑过的控制MU的方法包括闭环和开环方法[16 (https://arxiv.org/html/2605.29021#bib.bib69),20 (https://arxiv.org/html/2605.29021#bib.bib263),38 (https://arxiv.org/html/2605.29021#bib.bib254),3 (https://arxiv.org/html/2605.29021#bib.bib99)]。例如，Meng等人提出了一种用于部署机器人绳网系统的双环控制方案[20 (https://arxiv.org/html/2605.29021#bib.bib263)]。Zhu等人开发了一种反馈控制器，使机器人绳网系统能够捕获靠近的多块小尺寸空间碎片[38 (https://arxiv.org/html/2605.29021#bib.bib254)]。Boonrath等人提出了一种机器人网系统，配备比例-积分-微分推力控制器，并由强化学习策略引导，用于碎片捕获任务[3 (https://arxiv.org/html/2605.29021#bib.bib99)]。为了实现这种自主控制过程，重要的是仔细考虑结构、组件（支持自主性的，如传感器/执行器）和控制选择，而不是简单地采用传统的（基线）网和角部可机动单元（MU）的物理形式。本文提出了一个计算框架，能够高效地搜索由结构、组件和控制选择的联合考虑所带来的复杂混合连续-组合设计空间；其次，它为如何系统地（而非特设的）且有意义地（而非通过索引）抽象组合选项空间提供了概念验证；这可能对其他自主航天器系统的自动引导设计也有用。

同时优化此类系统的物理设计和受控轨迹是一项具有挑战性的任务。首先，绳网系统的硬件选择可能固有地涉及固定参数分组，而不是仅包含独立变量。在选择推进器的例子中，关键参数如推力饱和限制、比冲和干质量由制造商预定义，并且对于每种推进器类型是固定的。近年来，提出了更多方法来解决此类设计或最优控制问题中的混合组合非线性规划（MCNLP）问题。例如，为了有效处理卫星布局问题的组合方面，Xia等人[33 (https://arxiv.org/html/2605.29021#bib.bib24)]将其表述为混合整数规划，并使用了一种分离离散和连续变量的双层优化方法。Ringkamp等人[23 (https://arxiv.org/html/2605.29021#bib.bib43)]实现了时间变换的概念，将离散的整数控制时间区间转换为连续的时间函数，从而平滑了整数控制问题。尽管上述方法在解决某些工程问题中的MCNLP问题方面被证明是有效的，但它们依赖于对每个候选组合直接计算目标函数，如果目标函数涉及的仿真计算量大，则计算成本很高；此外，这些方法中组合空间内候选组合的关系没有以图示方式描绘出来。

另一方面，图已被证明可用于抽象经典和当代规划问题（以及一些设计问题）中的组合空间，这些问题被表述为组合优化问题，并且可以使用图神经网络[32 (https://arxiv.org/html/2605.29021#bib.bib70),28 (https://arxiv.org/html/2605.29021#bib.bib3)]来学习近似解。此类问题包括车辆路径规划[15 (https://arxiv.org/html/2605.29021#bib.bib52)]、多机器人任务分配[22 (https://arxiv.org/html/2605.29021#bib.bib53),21 (https://arxiv.org/html/2605.29021#bib.bib2)]和分子设计[35 (https://arxiv.org/html/2605.29021#bib.bib18)]。在我们之前的研究中，GNN已成功用于在挑战性环境中优化绳网系统的物理设计和受控轨迹[19 (https://arxiv.org/html/2605.29021#bib.bib72)]：利用图卷积网络（GCN）[36 (https://arxiv.org/html/2605.29021#bib.bib55)]高效地推荐给定非组合变量（如控制参数）向量的最佳组合组件（例如，推进器选择）。对于绳网协同设计问题，还有更多GNN结构有待探索，例如图注意力网络[29 (https://arxiv.org/html/2605.29021#bib.bib56)]和胶囊网络[30 (https://arxiv.org/html/2605.29021#bib.bib57)]。

受上述相关研究的启发，我们提出使用我们并行研究中更新的GNN辅助粒子群优化（PSO）框架，以最小化绳网系统在部署机动中的燃料消耗，同时确保成功捕获；这是通过优化其物理设计和所采用的控制来实现的。与我们之前的研究[19 (https://arxiv.org/html/2605.29021#bib.bib72)]相比，主要区别如下：1）GNN的结构已从单一的GNN切换为包含GNN编码器和MLP解码器的编码器-解码器架构。这种架构被称为边流图网络。2）图抽象已增强为表示有向图——边编码节点对之间目标函数差异，这是要学习的真实向量。而在早期工作中学习的是节点级分数，当前公式侧重于边级信号。这种抽象使得能够有效利用边关系，并允许将适应度分数之间的差异（这固有地代表问题的混合组合性质）直接编码到图上。3）问题的约束已被公式化为惩罚函数。4）绳网系统的设计空间已扩大，包含更多连续变量和组合变量。5）每个MU的最终（即部署结束时）期望速度现在由优化框架确定，这虽然增加了控制框架的复杂性，但也拓宽了可能的MU机动范围。

本文的主要贡献可总结如下：1）专用GNN损失函数：我们设计了一种专门的损失函数来训练GNN，以及相应的度量指标（例如，符号准确性）来评估训练后GNN的性能，从而在给定候选设计的连续部分时能够鲁棒地推荐组合选择。2）优化框架：我们开发了一个框架，用于结合嵌入的GNN进行联合结构-组件-控制优化，以提高主动绳网系统的机动效率，具体目标是最大化减小机动燃料成本，同时保持成功捕获碎片。在本工作中，我们使用PSO作为优化器，其结果通过序列二次规划进行后处理以保证最优性；然而，所提出的框架也兼容其他基于种群或基于梯度的算法。3）绳网仿真：我们更新了主动绳网系统，采用模型预测控制（MPC）系统（替代了早期的PID系统）作为底层控制器，用于跟踪最小能量参考路径以实现瞄准点（高层控制决策，与设计联合优化）。

本文的后续章节安排如下：第II部分 (https://arxiv.org/html/2605.29021#S2)介绍了主动绳网系统、其组件以及MU的控制器。第III部分 (https://arxiv.org/html/2605.29021#S3)介绍了优化框架和公式，以及嵌入的GNN模型。第IV部分 (https://arxiv.org/html/2605.29021#S4)讨论了测试场景中的优化结果。第V部分 (https://arxiv.org/html/2605.29021#S5)对本文进行了总结，并讨论了本研究的未来工作。

## II 绳网设计优化

### II-A 系统组件、任务流程及捕获成功评估

本工作所关注的基于网的ADR系统包括一个带有与其周边交织的闭合机制的机器人网、一根连接网与追踪航天器的主系绳，以及一个自主追踪航天器。追踪航天器是一个刚体，假设配备有绞盘、所有必要的子系统（包括推进系统）以及能够估计目标碎片相对位置、速度和角度状态的传感系统。对于网本身，在方形结构的角部，连接有MU和闭合机制线；在仿真中，网结构被建模为通过弹簧阻尼元件连接在一起的粒子集合，这些元件不能承受压缩。在此，每个MU代表一个纳米卫星大小的航天器，可以使用小型推进器和惯性测量单元进行导航和控制。图1(a) (https://arxiv.org/html/2605.29021#S2.F1.sf1)显示了本工作中使用的系统组件和参考坐标系，包括惯性参考系O={O,i^,j^,k^}\mathcal{O}=\{O,\mathbf{\hat{i}},\mathbf{\hat{j}},\mathbf{\hat{k}}\}——固定于网角部靠近MU1的初始位置，以及目标体固定坐标系D={D,d^x,d^y,d^z}\mathcal{D}=\{D,\mathbf{\hat{d}}_x,\mathbf{\hat{d}}_y,\mathbf{\hat{d}}_z\}——固定于目标的质心（CoM）。待捕获的目标碎片——其尺寸和质量信息列于表I (https://arxiv.org/html/2605.29021#S2.T1)——在仿真中是一个刚体，仿照Zenit-2火箭的末级建模。表I (https://arxiv.org/html/2605.29021#S2.T1)还列出了追踪航天器的属性。网的物理属性（除网线的轴向阻尼比设为0.106外）将通过后面定义优化过程来确定。

表I：碎片和追踪航天器组件设置|Parameter|Value|Unit|
|Debris Mass|9000|kg|
|Diameter|3.9|m|
|Length|11.0|m|
|Volume|125.3|m3|
|Surface Area|159.9|m2|
|Chaser Mass|1600|kg|
|Side length|1.5|m|
|MU上的推进器在任务开始时启动，以将网从追踪航天器发射出去并操纵其朝向目标。25秒后，推力被关闭，通过缩短并锁定交织在网周围的闭合机构线来闭合网。闭合机构的锁定段数NLN_{\text{L}}和捕获质量指数（CQI）被选为判断捕获是否成功的指标。CQI定义为：

J=0.1\|Vn−VD\|VD+0.1\|Sn−SD\|SD+0.8\|qn\|LcJ=0.1\frac{\|V_{n}-V_{D}\|}{V_{D}}+0.1\frac{\|S_{n}-S_{D}\|}{S_{D}}+0.8\frac{\|q_{n}\|}{L_{c}} (1)

在方程中，变量定义如下：网的凸包（CH）体积为VnV_{n}，碎片的体积为VDV_{D}，网的凸包表面积为SnS_{n}，碎片的表面积为SDS_{D}，碎片质心与网质心之间的距离为qnq_{n}，从碎片质心到其表面的最小距离为LcL_{c}。CQI值量化了碎片形状与网形状的相似度，以及它们质心之间的距离。Fo

利用图学习辅助混合组合优化的空间碎片捕获主动系绳网系统设计

相似文章

投影潜在强化学习动作：迈向通用的、可扩展的图组合优化

用于多智能体代码生成的检索条件拓扑选择及其可证明的预算守恒

学习跨域多智能体LLM协作的可迁移拓扑先验

TAROT：面向少样本表格学习的LLM先验图任务自适应精化

GaP：一种面向变体自动化任务的图即策略多智能体自学习框架

提交意见反馈