利用机器学习预测闪电网络中的通道关闭

arXiv cs.LG 论文

摘要

本文探讨了利用机器学习从gossip数据预测闪电网络通道是相互关闭还是强制关闭。一个带有时间特征的MLP优于基于图的模型,并且数据集已公开。

arXiv:2605.12759v1 公告类型:新 摘要:闪电网络(LN)是比特币的第二层协议,旨在实现快速且经济高效的链下交易。闪电网络中的通道可以通过双方协议关闭,也可以通过强制关闭单方面关闭,这会长时间锁定涉及的资本并降低网络可靠性。在本文中,我们研究从公开可用的gossip数据预测通道关闭类型的问题,将其视为随时间演变的通道图上的时间链接分类任务。我们构建了一个涵盖两年多LN活动的数据集,并基准测试了一系列机器学习方法,从MLP到时间图神经网络和谱编码。我们的实验表明,主要的预测信号是时间和行为上的,即每个端点最近的活动时间以及每个节点过去的关闭历史,而周围的网络拓扑并没有提供额外的好处。我们发现,一个在边级特征、节点级事件计数和时间模式上操作的简单MLP优于所有基于图的方法,并讨论了闪电网络固有的隐私性,其中关键信息如通道余额和支付流仍然隐藏,从根本上限制了仅从gossip数据预测关闭的可能性。我们公开了数据集和代码,网址为https://github.com/AmbossTech/ln-channel-closure-prediction,以鼓励对这个实际相关任务的进一步研究。
查看原文
查看缓存全文

缓存时间: 2026/05/14 06:18

# 使用机器学习预测闪电网络中的通道关闭
来源:https://arxiv.org/html/2605.12759
Simone Antonelli1,\*, Vincent Davis2, Harrison Rush2, Anthony Potdevin2, Jesse Shrader2, Vikash Singh3, Emanuele Rossi2,4

###### 摘要

闪电网络 \(LN\) 是比特币之上的一层二层协议,旨在实现快速且成本高效的链下交易。LN 中的通道可以通过双方协商一致关闭,也可以通过*强制关闭*单方面关闭,后者会将涉及的资本锁定较长一段时间,并降低网络可靠性。在本文中,我们研究从公开可用的 gossip 数据预测通道关闭类型的问题,并将其形式化为一个在演化通道图上的时间链路分类任务。我们构建了一个跨越两年多 LN 活动的数据集,并基准测试了一系列机器学习方法,从 MLP 到时间图神经网络和谱编码。我们的实验表明,主要的预测信号是时间性和行为性的,即每个端点的最近活动时间以及每个节点过去关闭的历史,而周围的网络拓扑结构并未提供额外益处。我们发现,一个在边级特征、节点级事件计数和时间模式上运行的简单 MLP 优于所有基于图的方法,并讨论了 LN 固有的隐私性(其中诸如通道余额和支付流等关键信息保持隐藏)如何从根本上限制了仅从 gossip 数据预测关闭的可能性。我们在 AmbossTech/ln-channel-closure-prediction (https://github.com/AmbossTech/ln-channel-closure-prediction) 公开发布了数据集和代码,以鼓励对这个具有实际相关性的任务进行进一步研究。

## I 引言

闪电网络 \(LN\) [1 (https://arxiv.org/html/2605.12759#bib.bib1)] 是比特币之上的二层协议,它将大部分支付转移到链下。两个用户通过联合在链上锁定比特币来打开一条*支付通道*,通过它路由任意数量的链下支付,并最终通过关闭通道在链上结算。

请参阅图注图 1:通道关闭预测任务概览。*左图*:闪电网络随时间演化,通道打开和关闭,形成一个时间图。*右图*:在时间 tt 的当前图状态下,我们预测每个开放通道在窗口 Δt\\Delta t 内是保持开放、协商关闭(mutual)还是强制关闭。

*协商关闭* 合作地结算通道并立即释放资金,而*强制关闭* 是单方面发起的,通常是因为一方无响应或发生争议,并将发起方的资金锁定数天至数周的时间锁期间。强制关闭代价高昂:它们消耗链上费用,冻结本可用于路由的流动性,并暂时降低网络容量。因此,预测强制关闭对于节点运营商、路由算法和流动性工具具有实际意义。更广泛地说,通道图的时间建模是运营商优化支付可靠性和赚取路由费用等结果的有用工具,这些结果不仅取决于网络的静态快照,还取决于图随时间演化(通道打开、关闭和更新其路由参数(费用、时间锁、禁用标志))的方式。

LN 的拓扑结构和通道元数据通过其*gossip 协议* 部分可观察,该协议广播通道打开、关闭以及定期更新,包括费用策略、容量和禁用标志。这些公开信息形成了一个时间图(图 1 (https://arxiv.org/html/2605.12759#S1.F1)),并引出了一个问题:*我们能否仅从 gossip 数据预测一个通道是保持开放、协商关闭还是强制关闭?*

先前的工作研究了 LN 的拓扑结构 [2 (https://arxiv.org/html/2605.12759#bib.bib2)]、流动性动态 [3 (https://arxiv.org/html/2605.12759#bib.bib3)],并将图神经网络(GNN)应用于基于快照的 LN 任务 [4 (https://arxiv.org/html/2605.12759#bib.bib4)],但尚未有工作明确建模通道关闭的时间演化。我们将上述问题形式化为一个*时间链路分类* 任务,并对其可预测性进行系统研究,在跨越两年多的每日 LN gossip 快照数据集(我们公开发布)上基准测试了随机基线、梯度提升树、MLP、GNN(静态和时间)以及谱图编码。我们的发现是:(i)主要的预测信号是时间性和行为性的,即端点活动最近性和每个节点的关闭历史,而静态通道元数据的信息量要小得多;(ii)图拓扑结构,无论是通过消息传递还是谱编码,都没有比使用每个通道和每个节点特征的简单 MLP 有所改进;(iii)整体预测性能仍然适中,这反映了一个根本性的信息差距,因为与关闭决策最相关的信号(余额、支付失败、节点正常运行时间)由于设计是私有的,并未通过 gossip 披露。

## II 问题陈述

我们考虑 [5 (https://arxiv.org/html/2605.12759#bib.bib5)] 中定义的*时间图* 的概念,即一组发生在不同时间戳的事件,它们共同构建了最终的图结构:

G={x\(tm\):tm−1≤tm≤tm\+1,form∈\[1,2,...\]}\{\\mathcal\{G\}\}=\\\{x\(t\_\{m\}\)):t\_\{m\-1\}\\leq t\_\{m\}\\leq t\_\{m\+1\},\\text\{ for \}m\\in\[1,2,\\dots\]\\\}每个事件 x\(t\)x\(t\) 属于两种类型之一:*节点级事件* vi\(t\)\{\\bm\{v\}\}\_\{i\}\(t\),涉及节点的添加、删除或特征更新;或*交互事件* eij\(t\)\{\\bm\{e\}\}\_\{ij\}\(t\),表示边(即支付通道)在两个节点 ii 和 jj 之间的添加或移除。在时间 tt 的图,记为 G\(t\)\{\\mathcal\{G\}\}\(t\),由对 (V\(t\),E\(t\)\)\\left\(\{\\mathcal\{V\}\}\(t\),\{\\mathcal\{E\}\}\(t\)\\right\) 定义,其中 V\(t\)=\{i:vi\(tm\)∈G 且 tm≤t\}\{\\mathcal\{V\}\}\(t\)=\\\{i:\{\\bm\{v\}\}\_\{i\}\(t\_\{m\}\)\\in\{\\mathcal\{G\}\}\\text\{ and \}t\_\{m\}\\leq t\\\} 是截至时间 tt 存在的节点集合,E\(t\)=\{\(i,j\):eij\(tm\)∈G 且 tm≤t\}\{\\mathcal\{E\}\}\(t\)=\\\{\(i,j\):\{\\bm\{e\}\}\_\{ij\}\(t\_\{m\}\)\\in\{\\mathcal\{G\}\}\\text\{ and \}t\_\{m\}\\leq t\\\} 是截至时间 tt 的有向边集合。由于 LN 中的支付是双向流动的,如果 eij\(tm\)\{\\bm\{e\}\}\_\{ij\}\(t\_\{m\}\) 表示一条从 ii 到 jj 的边,那么也存在方向相反的 eji\(tm\)\{\\bm\{e\}\}\_\{ji\}\(t\_\{m\}\)。我们将时间 tmt\_\{m\} 的通道打开记为 eij\+\(tm\)\{\\bm\{e\}\}\_\{ij\}^\{\+\}\(t\_\{m\}\),通道关闭记为 eij−\(tm\)\{\\bm\{e\}\}\_\{ij\}^\{\-\}\(t\_\{m\}\)。

在处理时间任务时,区分*当前时间* 和*查询时间* 非常重要。在给定时刻 tt(当前时间),模型预测未来某个点 t\+Δtt\+\\Delta\_\{t\}(查询时间)的某个属性,其中 Δt\\Delta\_\{t\} 是一个可配置的展望窗口。手头的任务可以形式化为一个*时间链路分类* 问题:对于在*当前* 时间戳 tmt\_\{m\} 处于*开放* 状态的每条边,目标是预测其在查询时间 tm\+Δtt\_\{m\}+\\Delta\_\{t\} 的状态为 open、mutual 或 forced(参见第 III-A 节)。在我们的实验中,我们设置 Δt=180\\Delta\_\{t\}=180 天。一条边在时间戳 tmt\_\{m\} 是*开放* 的,当其到目前为止 tm 的最远交互事件是通道打开时。形式上,令 E\+\(tm\)=\{\(i,j\)∣∃eij\+\(t\) 且 t≤tm\}\{\\mathcal\{E\}\}^\{\+\}\(t\_\{m\}\)=\\\{\(i,j\)\\mid\\exists\\,\{\\bm\{e\}\}\_\{ij\}^\{\+\}\(t\)\\text\{ with \}t\\leq t\_\{m\}\\\} 且 E−\(tm\)=\{\(i,j\)∣∃eij−\(t\) 且 t≤tm\}\{\\mathcal\{E\}\}^\{\-\}\(t\_\{m\}\)=\\\{\(i,j\)\\mid\\exists\\,\{\\bm\{e\}\}\_\{ij\}^\{\-\}\(t\)\\text\{ with \}t\\leq t\_\{m\}\\\}。那么开放边的集合是 Eopen\(tm\)=E\+\(tm\)∖E−\(tm\)\{\\mathcal\{E\}\}\_\{\\text\{open\}\}\(t\_\{m\}\)=\{\\mathcal\{E\}\}^\{\+\}\(t\_\{m\}\)\\setminus\{\\mathcal\{E\}\}^\{\-\}\(t\_\{m\}\)。因此,一条*开放* 边是通道的一种持续状态,而交互事件是修改 G\(tm\)\{\\mathcal\{G\}\}\(t\_\{m\}\) 的单一发生事件。

## III 数据集

我们从 LN 的 gossip 消息中收集每日快照^{11},涵盖从 2022 年 6 月 9 日到 2024 年 10 月 14 日的时期。原始数据包括在 874874 个时间戳上记录的 693 277693\\,277 个有向事件(通道打开和关闭),涉及 36 17036\\,170 个唯一节点。

处理初始快照。第一个 gossip 快照(2022 年 6 月 9 日)捕获了当时 LN 的整个状态,包含单个时间戳上的 358 994358\\,994 个事件(超过数据集的一半)。这些事件代表了网络累积的历史,而非实时活动。为了处理这个问题,我们采用*热启动* 策略:第一天的事件初始化图状态(填充开放通道集合和节点级统计信息),但被排除在训练、验证和测试之外。这样,模型从真正的时间活动中学习,同时保留在观察期开始时访问网络结构的能力。

并行通道。LN 本质上是一个多重图,两个节点可以同时维护多个通道。为了将其简化为简单图,我们移除所有在它们之间具有多于一个通道的节点对。这影响了大约 3% 的节点对,并使总事件数减少大约 20%,但当多个通道连接同一对端点时,消除了使用哪个通道属性的歧义。

按时间分割。为了防止信息泄漏,我们按时间线将剩余数据按时间顺序分割为训练集、验证集和测试集,使用 70%/15%/15%70\\%/15\\%/15\\% 的分割比例。每个事件包含一个 channel_status 属性,指示它是通道打开还是关闭;此信息来源于 gossip 消息,并且在事件发生时可用,因此使用它不会构成未来信息的泄漏。

标签。我们根据未来状态为开放边分配标签。对于在时间 tt 开放的任意边,我们检查是否在接下来的 Δt=180\\Delta\_\{t\}=180 天内发生了涉及同一条边的关闭事件。如果找到关闭事件,则根据相应的关闭类型(forced 或 mutual)为该边打标;否则,它保持标记为 open。

### III-A 类别

请参阅图注图 2:标签计数随时间分布。该图显示了数据集中三个标签(forced、mutual、open)随时间演化的分布,垂直虚线表示验证期和测试期的起始点。该任务是一个多类链路分类问题,目标是预测通道在时间窗口内(从当前时间戳到查询时间戳)的状态。每个通道可以取以下类别之一,反映其在 LN 中的状态:

- •open:通道在 Δt\\Delta\_\{t\} 内正常运行。
- •mutual:在 Δt\\Delta\_\{t\} 内达成协商关闭协议。
- •forced:通道在 Δt\\Delta\_\{t\} 内被单方面关闭。

一小部分(<0.01%<0.01\\%)关闭被归类为 penalty,我们将其合并到 forced 类别中。

请参阅图注图 3:训练集、验证集和测试集分割中三个类别(open、forced、mutual)的每日平均分布。比例是通过首先计算每日分数,然后对每个分割内的所有天数进行平均得到的。图 2 (https://arxiv.org/html/2605.12759#S3.F2) 显示了事件标签随时间分布。尽管事件总数随时间推移而减少,但相对比例保持相当一致。在整个热启动后的数据中,open 通道约占 47%,mutual 关闭约占 30%,forced 关闭约占 23% 的事件。然而,在预测时间点,当模型必须分类*所有当前开放的边* 时,分布严重倾斜:大约 83%83\\% 的开放边保持 open,约 9%9\\% 最终作为 mutual 关闭,8%8\\% 作为 forced 关闭。图 3 (https://arxiv.org/html/2605.12759#S3.F3) 显示了三个时间分割中每个分割内的平均类别分布。

### III-B 节点和边特征

每个事件在通道(边)和端点(节点)级别都携带特征,如相应 gossip 消息中所报告的。对于每个通道,我们保留链上时间戳(ts、height)、锁定的 capacity 以及资金区块的 block_avg_fee_rate;标识符和标签(transaction_id/vout、channel_status、event_label、gossip_ts)作为元数据用于记账和作为预测目标,但不提供给模型。对于每个端点,我们分别针对源和目的地保留 gossip 中声明的路由策略参数:基础费用和比例费用(fee_base_msat、fee_rate_milli_msat)、HTLC 边界(min_htlc、max_htlc_msat)、time_lock_delta、disabled 标志、该方向最新 gossip 更新的时间戳(last_update)以及节点的 LN implementation。我们保留通道方向性,因此将 (src、dst) 与 (dst、src) 分开处理。所有特征直接取自 gossip,数据集按 gossip_ts 排序以保持时间顺序。

## IV 方法论

我们研究一个*时间链路分类* 任务,其目标是在给定一个通道截至用户定义查询时间的历史记录的情况下,预测其未来状态。大多数现有时间图基准 [6 (https://arxiv.org/html/2605.12759#bib.bib6),7 (https://arxiv.org/html/2605.12759#bib.bib7)] 侧重于*链路预测*,即预测两个节点之间在未来时刻是否会形成一条边。相比之下,在我们的设置中,我们已知通道存在,而是未来时刻对其状态(open、mutual 或 forced)进行分类。类别不平衡是这里的一个关键挑战,因为在任何给定时刻大多数通道保持开放,只有相对较少的通道在预测窗口内关闭。

形式上,给定一个模型 MM、一个时间窗口 Δt\\Delta\_\{t\}、当前时间戳 tt 以及截至时间 tt 观察到的开放通道图 G\(t\)\{\\mathcal\{G\}\}\(t\),任务定义如下:

对于每条开放边 e∈Eopen\(t\)e\\in\{\\mathcal\{E\}\}\_\{\\text\{open\}\}\(t\),令 t′=t+Δtt^\{\\prime\}=t\+\\Delta\_\{t\} 为查询时间:1. 计算模型预测 =M\(e,t′\)s=M\(e,t^\{\\prime\}\) 并对可能的类别应用 softmax,2. 使用分类指标(例如 F1-score、准确率)评估 ss。

换句话说,对于时间 tt 的每条开放通道,我们根据截至 tt 观察到的所有事件,预测其在 t′=t+Δtt^\{\\prime\}=t\+\\Delta\_\{t\} 的状态。在每个训练步骤中,模型预测*所有* 当前开放边的状态,而不仅仅是当前批次事件中涉及的边。这与标准链路预测不同,在标准链路预测中,每个步骤通常只考虑采样的边子集,并且使得评估更接近部署模型在实际使用中的方式。

我们在时间图网络(TGN)框架 [5 (https://arxiv.org/html/2605.12759#bib.bib5)] 上构建我们的时间评估流程,针对我们的设置调整了其两个组件。首先,我们将原始的*邻居加载器*(它为查询节点采样固定数量的最近邻居)替换为一个变体,该变体维护当前开放边的完整集合,在通道打开时插入,在关闭时移除。在每个步骤中,该加载器提供所有开放边用于预测。其次,我们将 TGN 的学习型 RNN 记忆模块替换为一个更简单的非参数*特征存储*,该存储累积事件计数(open、forced、mutual)。

相似文章

量化并缓解前沿大语言模型中的过早闭合

arXiv cs.CL

本文定义并衡量了前沿大语言模型中的过早闭合现象,发现即使正确选项被移除或需要澄清时,模型仍频繁给出自信的回答,凸显了医疗应用中的一个关键安全问题。

估计开放权重大型语言模型的最坏情况前沿风险

OpenAI Blog

OpenAI 研究人员通过在生物学和网络安全领域进行恶意微调(MFT)来研究发布开放权重大型语言模型的最坏情况前沿风险,发现开放权重模型的表现不如前沿闭源模型,且不会显著提升有害能力。