HIA-GAT:一种用于高速公路帧级交通冲突风险预测的异构交互感知图注意力网络
摘要
本文提出了HIA-GAT,一种双流异构图注意力网络,它结合了纵向和横向车辆交互以及冲突类型感知门控机制,用于高速公路帧级交通冲突风险预测。在NGSIM数据集上的实验表明,该方法提高了风险排序性能,尤其是横向冲突,并提供了可解释的每辆车冲突归因。
arXiv:2606.27577v1 Announce Type: new
摘要:本文将以高速公路帧级风险评估表述为一个多智能体场景图级别的二分类问题,其中如果任何基于TTC或PET的冲突违反了指定的严重性阈值,则该视频或轨迹帧被标记为危险。我们为每一帧构建一个关系感知图,以车辆为节点,两种交互类型为边:同车道(纵向)和相邻车道(横向),并增强了与追尾和变道冲突机制一致的物理信息边特征。在非图模型和图基线的结构化基准测试套件的基础上,我们提出了HIA-GAT,一种双流异构图注意力网络,它通过专用的注意力路径处理纵向和横向交互,并通过冲突类型感知门控机制将它们融合,该门控机制具有从SSM冲突归因衍生出的事件级门控监督。在NGSIM I-80和US-101高速公路数据集上,跨九种TTC和PET阈值配置的实验表明,HIA-GAT达到了最佳的平均风险排序性能(在I-80上AUC为0.835,在US-101上AUC为0.867),并在仅使用PET(变道)的设置中取得了最大的提升,因为在这些设置中关系结构至关重要。除了准确性之外,学到的门控提供了主导冲突类型的可解释的每辆车归因,支持可操作的实时高速公路安全监控。我们表明,图结构对于建模横向冲突风险至关重要,而纵向风险通常可以通过非关系聚合来捕获。
查看缓存全文
缓存时间: 2026/06/29 05:23
# HIA-GAT:一种用于高速公路帧级交通冲突风险预测的异构交互感知图注意力网络 来源:https://arxiv.org/html/2606.27577 Mahshid Malazizi 查塔努加城市信息学与进展中心 田纳西大学查塔努加分校 美国田纳西州查塔努加市,37403 ntv774@mocs\.utc\.edu &Seyedmehdi Khaleghian 查塔努加城市信息学与进展中心 田纳西大学查塔努加分校 美国田纳西州查塔努加市,37403 mehdi\-khaleghian@utc\.edu &Mina Sartipi 查塔努加城市信息学与进展中心 田纳西大学查塔努加分校 美国田纳西州查塔努加市,37403 Mina\-Sartipi@utc\.edu &Toru Hirano 电装国际美国公司 美国密歇根州南菲尔德市 &Yunfei Xu 电装国际美国公司 美国密歇根州南菲尔德市 &Hoang H\. Nguyen 查塔努加城市信息学与进展中心 田纳西大学查塔努加分校 美国田纳西州查塔努加市,37403 huuhoang\-nguyen@utc\.edu ###### 摘要 本文将帧级高速公路风险评估形式化为一个多智能体场景(图级)二元分类问题,其中每个视频/轨迹帧被标记为风险帧,如果任何基于TTC或PET的冲突违反了指定的严重性阈值。我们为每一帧构建一个关系感知图,以车辆为节点,两种交互类型为边——同车道(纵向)和相邻车道(横向)——并补充了与追尾和变道冲突机制对齐的物理信息边特征。基于一个结构化的非图模型和图基线的基准测试套件,我们提出了HIA-GAT,一种双流异构图注意力网络,它通过专用的注意力路径处理纵向和横向交互,并通过一种冲突类型感知的门控机制进行融合,该机制使用来自SSM冲突归因的事件级门监督。在NGSIM I-80和US-101高速公路数据集上,针对九种TTC/PET阈值配置进行的实验表明,HIA-GAT实现了最佳的平均风险排名性能(I-80上AUC为0.835,US-101上为0.867),在关系结构至关重要的纯PET(变道)设置中取得了最大的提升。除了准确性之外,学习到的门控提供了每个车辆的主导冲突类型的可解释归因,支持可操作的、实时的高速公路安全监控。我们表明,图结构对于建模横向冲突风险至关重要,而纵向风险通常可以通过非关系聚合来捕获。 ## 1 引言 交叉口和高速公路设施处的交通安全分析传统上依赖于历史碰撞记录。虽然对长期规划至关重要,但基于碰撞的方法是反应性的,并且受到稀疏、延迟观测的限制\[84 (https://arxiv.org/html/2606.27577#bib.bib84)\]。为了支持主动评估,替代安全度量(SSMs),特别是碰撞时间(TTC)和后侵占时间(PET),被广泛用于在碰撞发生前量化冲突严重性和接近碰撞的动态\[38 (https://arxiv.org/html/2606.27577#bib.bib38)\]。然而,在复杂设施处的实时安全评估仍然具有挑战性。路侧视频传感和计算机视觉现在提供了一种可扩展、经济高效的方式来提取多个道路使用者的上下文和运动学信息\[12 (https://arxiv.org/html/2606.27577#bib.bib12)\]。然而,将有噪声的多智能体轨迹转换为可靠的帧级安全指标仍然困难,因为SSM定义在成对交互上,而真实场景包含许多必须综合到场景级别的同步交互。
现有的基于冲突的研究主要关注交叉口和特定交互类型\[75 (https://arxiv.org/html/2606.27577#bib.bib75),76 (https://arxiv.org/html/2606.27577#bib.bib76),77 (https://arxiv.org/html/2606.27577#bib.bib77)\],而更广泛的SSM研究强调阈值、碰撞结果关联、影响因素以及针对碰撞数据的验证\[75 (https://arxiv.org/html/2606.27577#bib.bib75),78 (https://arxiv.org/html/2606.27577#bib.bib78),79 (https://arxiv.org/html/2606.27577#bib.bib79),80 (https://arxiv.org/html/2606.27577#bib.bib80)\]。这在视频兼容、实时、针对多交互智能体场景的帧级风险评估方面留下了空白。这一空白对于高速公路环境尤其重要,尽管与交叉口相比,高速公路表现出不同的交通动态,但在基于冲突的风险评估中相对较少受到关注。在高速公路和快速路上,主要的冲突机制通常是追尾交互和变道/侧擦冲突\[21 (https://arxiv.org/html/2606.27577#bib.bib21),82 (https://arxiv.org/html/2606.27577#bib.bib82)\]。实证发现进一步表明,换道行为及其相关风险受到操作后相关前车的纵向间距的强烈调节\[81 (https://arxiv.org/html/2606.27577#bib.bib81)\]。这些特性激发了一种建模方法,该方法(i)能够表示许多并发交互,(ii)能够区分冲突机制(纵向与横向),(iii)能够提供适合连续监控的帧级风险预测。
为了解决这些局限性,我们开发了一个基于TTC和PET的全面*帧级*高速公路交通风险评估框架。我们将评估组织为三个架构复杂性递增的层级:*(1) 非图基线*,在帧级聚合上操作;*(2) 无边特征的GNN基线*,以隔离关系结构的贡献;以及*(3) 单流GNN基线(HomoGAT)*,通过统一的消息传递,在多个SSM阈值设置及其组合下整合SSM相关信息。在这些基线的基础上,我们提出了HIA-GAT,一种异构交互感知图注意力网络,它将车辆交互分解为冲突类型特定的消息传递流——*纵向*和*横向*——并通过一个由物理基础边特征指导的门控机制进行融合。这种设计实现了原则性的、帧级交通风险分类,与TTC和PET捕获的底层机制对齐,同时保持与视频导出的多智能体轨迹的兼容性。
总之,本文做出以下贡献:
- • 我们将*帧级*高速公路风险评估形式化为一个使用TTC和PET从轨迹数据中导出操作风险标签的多智能体场景分类问题。
- • 我们提供了一个结构化的基准测试套件,涵盖非图模型、仅拓扑GNN以及单流注意力基于GNN的基线(HomoGAT),在多种SSM阈值配置及其组合下进行评估。
- • 我们引入了HIA-GAT,一种具有冲突类型特定消息传递和使用物理基础边特征的门控融合的异构交互感知架构,实现了与机制对齐且可解释的帧级风险预测。
## 2 相关工作
传统的安全分析依赖于历史碰撞数据和回归模型\[24 (https://arxiv.org/html/2606.27577#bib.bib24)\],本质上是反应性的,无法支持实时评估。替代安全度量(SSM),如TTC\[38 (https://arxiv.org/html/2606.27577#bib.bib38)\]和PET\[34 (https://arxiv.org/html/2606.27577#bib.bib34)\],实现了主动冲突检测\[18 (https://arxiv.org/html/2606.27577#bib.bib18)\],但通常依赖于固定阈值\[20 (https://arxiv.org/html/2606.27577#bib.bib20)\],并且无法扩展到多智能体、帧级风险估计。机器学习方法——包括支持向量机、随机森林和深度学习——提高了预测性能\[44 (https://arxiv.org/html/2606.27577#bib.bib44),19 (https://arxiv.org/html/2606.27577#bib.bib19)\],然而大多数针对特定用户群体或依赖手工特征,限制了其表示异构交互的能力。
图神经网络通过显式建模交通智能体之间的关系结构来解决这一局限性。最近的工作已将异构GNN应用于交叉口安全,包括用于碰撞概率估计的多关系GCN\[22 (https://arxiv.org/html/2606.27577#bib.bib22)\]、具有动态异构图的时空GCN\[87 (https://arxiv.org/html/2606.27577#bib.bib87)\],以及具有行人及车辆不同节点类型的基于图的框架\[88 (https://arxiv.org/html/2606.27577#bib.bib88)\]。然而,这些工作仅关注交叉口和行人场景。在高速公路上,变道和合流是主要冲突因素,结合TTC和PET比单独使用任一度量都能改善碰撞估计\[21 (https://arxiv.org/html/2606.27577#bib.bib21)\],但现有方法孤立地分析单个冲突对,而不是联合建模整个多智能体场景\[81 (https://arxiv.org/html/2606.27577#bib.bib81)\]。我们的工作通过将基于SSM的冲突标记与用于帧级高速公路风险评估的异构图建模相统一,解决了这些空白。
## 3 方法论
### 3.1 问题形式化
本研究考虑使用高分辨率车辆轨迹数据对高速公路路段进行*实时*交通冲突风险预测。原始数据包括在离散时间步(帧)记录的运动学观测。学习目标是为每一帧分配一个二元标签——*风险*或*安全*——基于在该帧中观测到的车辆中是否存在任何替代安全度量(SSM)违规。
令F = {f1, f2, ..., fT}表示有序的帧集合。在时间步t处,帧ft包含一组活跃车辆Vt = {v1, v2, ..., vNt},具有状态属性,如位置、速度、加速度、车道分配和车头时距。我们旨在学习一个参数化预测器ŷt = gθ(Vt, Et),该预测器将车辆及其交互映射到一个二元标签yt ∈ {0,1},其中yt = 1表示风险帧,yt = 0表示安全帧。这里,Et表示在时间t处车辆间成对交互关系的集合。
我们将该问题视为*图级*二元分类。每帧表示为一个有向的、关系感知图Gt = (Vt, Et, Xt, Et),其中Xt ∈ R^{Nt × d0}是节点特征矩阵,Et表示编码交互动态的边属性。真实标签yt直接从轨迹中计算的SSM推导而来。
### 3.2 用于风险标记的替代安全度量
SSM提供了一个量化框架,用于评估交通冲突严重性,而不依赖于观测到的碰撞记录,这些碰撞记录在高速公路上本来就很稀少且在空间上分散。在本研究中,我们采用两种互补的SSM,它们捕获了高速公路设施上的两种主要冲突类型:由纵向接近交互引起的追尾冲突,以及由横向变道操作引起的侧擦冲突。
#### 3.2.1 碰撞时间 (TTC)
碰撞时间 (TTC) 测量同车道跟随车i和领车j之间潜在追尾冲突的剩余时间。对于主动接近且保险杠间隙为正的车辆对,TTC计算为TTCij(t) = dij(t) / Δvij(t),其中Δvij(t) = vi(t) - vj(t) > vmin,dij(t)是空间车头时距减去前车长度,vmin = 0.5 ft/s以排除准静止对。TTC仅在dij(t) > 0时进行评估。
#### 3.2.2 后侵占时间 (PET)
后侵占时间捕获变道操作期间连续占用共享道路空间的时间裕度。与测量正在进行的纵向接近交互的TTC不同,PET测量在空间冲突点处的时间间隔,该点已被一辆车先行通过而随后由另一辆车进入(见图1 (https://arxiv.org/html/2606.27577#S3.F1))。
参见图注
图 1:高速公路路段上PET计算的说明。**上**:时间序列显示前车在时间ti-1处穿过入侵线,换道车辆在时间ti处穿过;PET是这两个占用事件之间的经过时间。**下**:冲突的空间配置:车道1中的车辆Ft和正在执行换道进入车道2的车辆M,入侵线标记共享道路空间,在该空间内纵向重叠产生潜在的侧擦冲突点。
我们使用基于单元格的空间占用方法计算PET。高速公路的纵向范围被离散化为宽度为Δs(设为5英尺)的单元格。对于每个时间步的每辆车,根据车辆的前后位置确定其占用的单元格集。当检测到持续换道——定义为车辆过渡到相邻车道并保持新车道分配至少τsustain个连续帧(设为1.0秒)——该算法识别目标车道中每个单元格的最近先前占用者。冲突对的PET是所有共享单元格上的最小时间间隔PETij(t) = (tentry,i - texit,j) / FR,其中tentry,i是换道车辆i进入目标车道单元格的帧,texit,j是先前占用车辆j存在于该单元格中的最后一帧,FR是帧率(10 Hz)。应用0.2秒的最小PET下限,以排除由传感器噪声引起的物理上不可能的检测。
#### 3.2.3 基于阈值的风险标记
为了评估模型在不同冲突严重程度下的性能,我们定义了九种阈值配置,涵盖三个类别。对于追尾交互,我们考虑TTC阈值为0.5s、1.0s和1.5s,分别对应于迫近、严重和预防性冲突状态。对于变道交互,我们考虑PET阈值为1.0s、1.5s和2.0s,以表示紧密、中等和边缘侧擦冲突。最后,我们使用联合TTC | PET标准评估组合配置——即 (TTC < 0.5s | PET < 1.0s)、(TTC < 1.0s | PET < 1.5s) 和 (TTC < 1.5s | PET < 2.0s)——其中如果*任一*条件满足,则该帧被标记为风险帧。这种多阈值框架能够对异构冲突机制和风险严重性进行系统性的鲁棒性分析,范围从高度不平衡的设置(例如,TTC < 0.5s 风险发生率约为5–14%)到更平衡的标签分布(例如,TTC < 1.5s | PET < 2.0s 风险发生率约为)。相似文章
用于交通预测的全局-局部图注意力网络
提出了一种具有成对编码和基于事件的邻接矩阵的全局-局部图注意力网络(GLGAT)用于交通预测,有效捕捉时空相关性,并在真实数据集上取得了有竞争力的性能。
时间增强图注意力网络用于可供性分类
EEG-tGAT是一种时间增强的图注意力网络,通过融合时间注意力和dropout机制来改进交互序列的可供性分类。该模型在GATv2基础上进行了增强,适用于时间维度语义不均匀的序列数据。
Hierarchical Global Attention (HGA)
Hierarchical Global Attention (HGA) 是一种可直接替换预训练长上下文Transformer中密集因果注意力的方法。它采用分层两级路由机制,使得能够对一个小规模路由工作集进行精确注意力计算,从而允许像 Qwen3-30B 这样的模型在单个 RTX 5090 上以64K上下文运行,且质量损失极小。
用于交通预测的图条件图神经网络专家混合模型
提出了GC-MoE,一种用于交通预测的图条件专家混合框架,该框架根据图拓扑和近期输入为每个节点分配个性化的冻结预训练时空图神经网络专家组合,仅训练一个轻量级路由模块(约1.7万个参数),并在四个基准数据集上取得了有竞争力的性能。
面向融合出行-能源供应链网络的图驱动跨行业实时反洗钱监测框架
本文提出了一种面向跨行业供应链网络的图驱动实时反洗钱监测框架(GCRMF),利用异构图和时间注意力网络,实现了超过17.8%的F1分数提升。