CausalPOI:基于时空图的因果建模用于冷启动POI签到预测
摘要
提出CausalPOI,一个基于时空图的因果表示学习框架,用于冷启动POI签到预测,在真实世界的SafeGraph数据集上显著优于现有最先进基线。
arXiv:2606.05413v1 公告类型:新论文
摘要:随着城市环境的快速演变,准确建模兴趣点(POI)的动态行为对于支持数据驱动的城市规划和商业决策至关重要。尽管时空图学习的最新进展改进了POI预测,但大多数方法依赖基于邻近性的图和相关性驱动建模,忽略了POI之间的功能依赖关系,并且无法捕捉城市干预的因果效应。在本文中,我们引入了一个新的研究问题——冷启动POI签到预测,旨在通过建模新引入POI的时间演变及其与附近POI在结构化城市空间环境中的功能交互,来预测其未来的签到模式。为应对这些挑战,我们提出CausalPOI,一个基于时空图的因果表示学习框架。CausalPOI利用时空功能交互图来建模POI之间的语义和空间关系,并构建结构对齐的处理图和对照图来模拟事实和反事实场景。在真实世界SafeGraph数据集上的大量实验表明,CausalPOI在各个方面显著优于最先进的基线,验证了其在时空预测、语义交互建模和因果效应估计方面的有效性,为城市干预分析提供了更具可解释性和可操作性的基础。源代码可在Github上获取。
查看缓存全文
缓存时间: 2026/06/05 08:10
# CausalPOI:基于时空图的因果建模用于冷启动POI签到预测
来源:https://arxiv.org/html/2606.05413
(2026)
###### 摘要
随着城市环境的快速演变,准确建模兴趣点(POI)的动态行为对于支持数据驱动的城市规划和商业决策至关重要。尽管时空图学习的最新进展提升了POI预测能力,但大多数方法仍依赖于基于邻近度的图和相关驱动的建模,忽略了POI之间的功能依赖性,也无法捕捉城市干预的因果效应。本文引入了一个新颖的研究问题——冷启动POI签到预测,旨在通过建模新引入POI的时间演化及其与附近POI在结构化城市空间背景下的功能交互,来预测其未来的签到模式。为了应对这些挑战,我们提出了CausalPOI,一个基于时空图的因果表示学习框架。CausalPOI利用时空功能交互图来建模POI之间的语义和空间关系,并构建结构对齐的处理图和控制图,以模拟事实和反事实场景。在真实世界SafeGraph数据集上进行的大量实验表明,CausalPOI在各评估指标上显著优于最先进的基线方法,验证了其在时空预测、语义交互建模和因果效应估计方面的有效性,为城市干预分析提供了更可解释和可操作的基础。源代码可在Github上获取:https://github.com/ZZQ-NTU/CausalPOI\。
冷启动POI签到预测,时空图神经网络,因果推断,城市计算
††期刊年份:2026††版权:cc††会议:第32届ACM SIGKDD知识发现与数据挖掘会议V.2;2026年8月9–13日,韩国济州岛††书籍标题:第32届ACM SIGKDD知识发现与数据挖掘会议V.2 (KDD '26),2026年8月9–13日,韩国济州岛††doi:10.1145/3770855.3817641††isbn:979-8-4007-2259-2/2026/08††ccs:信息系统 地理信息系统††ccs:计算方法 时间推理††ccs:计算方法 因果推理与诊断
## 1. 引言
城市环境本质上是动态的,其特点是兴趣点(POI)——如餐馆、健身房、图书馆和零售店——不断涌现、演变和消失(Zhang等,2024)。这些POI在塑造人类移动模式、影响经济活力以及定义城市空间结构方面发挥着核心作用。理解和预测POI层面的行为对于广泛的应用程序至关重要,包括商业选址、交通规划和公共基础设施部署。传统的预测方法主要依赖大规模时空数据——如聚合的移动流量或区域级签到统计数据——来模拟城市活动模式。这些方法(Liu等,2021;Yuan等,2024)通常利用粗粒度的空间特征,将城市空间视为同质区域的集合,并依赖于它们之间的统计相关性来预测未来趋势。虽然这类模型在宏观层面提供了有用的见解,但它们难以捕捉单个POI的细粒度动态和局部影响——例如流行度的时间爆发、随时间的功能变化,以及密集城市集群中的竞争和互补效应。
考虑一个真实场景:一个繁忙的城市社区即将开设一家新健身房。在开业之前,商业运营者和数字服务平台希望回答一个关键问题:未来几周内,预计会有多少人签到这家新设施?准确预测新开设健身房的签到量对于评估会员需求、分配健身教练和设备以及规划课程安排至关重要。与依赖POI历史数据的传统预测任务(Yang等,2018;Hajisafi等,2023;Li等,2024)不同,这种设定涉及预测一个冷启动POI——即没有先前行为观察数据的POI——的用户活动。为了做出可靠的预测,模型必须推断将新健身房引入现有城市生态系统后可能产生的需求。这不仅需要对空间上下文以及与附近POI的功能关系进行建模,还需要理解新POI可能如何因果地影响其周围环境以及被其影响。例如,竞争性健身房的存在可能对新开设场所的受欢迎程度产生负面影响,而互补性业务(如冰沙吧)则可能增加客流量。这种反事实推理对于区分真实效应与虚假相关性至关重要,而传统的预测模型无法完全捕捉这一点,因为它们主要关注相关性而非因果性。
最近的研究(Yu等,2017;Guo等,2019;Wu等,2020;Zhang等,2026)越来越多地使用时空数据和基于图的方法来建模城市活动模式。特别是,图神经网络(GNN)(Brody等,2021)已被广泛采用来捕捉POI之间的空间相关性和关系依赖性,通常通过基于地理邻近性构建图来实现。这些方法在历史数据可用且城市拓扑结构相对静态的设定下,在POI活动预测方面取得了成功。此外,因果表示学习的早期工作探索了在潜在结果框架下估计个体处理效应(ITE)(Liu等,2020;Wang等,2022),提供了从观测数据推理干预效果的工具。
尽管取得了这些进展,但在建模POI动态以支持决策时仍存在两个基本挑战:(1)**功能交互建模**。现有的基于图的预测方法主要依赖空间邻近性来定义关系,忽略了POI之间的语义功能和真实世界交互。这种简化限制了模拟竞争和互补性的能力,而这对于准确预测和规划至关重要。(2)**结构化空间中的因果估计**。尽管有些方法尝试估计处理效应,但它们通常忽略城市环境的空间结构,并依赖非结构化表示。因此,它们无法模拟引入新POI等干预措施如何通过空间依赖性影响周边区域。
本文引入了一个新颖的研究问题——如何通过显式表示新引入POI的时间演化及其与周围POI的功能交互来建模其对城市移动模式的因果效应,这可以形式化为一个冷启动POI签到预测问题。与先前的区域级流量预测或标准图预测任务不同,我们的设定侧重于局部空间干扰下的POI级干预感知预测,其中新POI的引入改变了局部功能交互上下文。为了应对上述挑战,我们提出了CausalPOI,一个基于时空图的表示学习框架,用于POI级预测。CausalPOI集成了两个关键组件:时空功能交互图(ST-FIG)模块,用于捕捉POI之间的空间邻近性和语义功能关系;以及因果推断模块,通过模拟反事实场景来估计新引入POI的个体处理效应(ITE)。在ST-FIG中,交互强度通过对比预训练进行学习,使模型能够发现超越物理距离的潜在语义依赖性。因果模块构建结构对齐的处理图和控制图,并通过共享的图神经网络(GNN)编码器和时间解码器来估计ITE。本文的主要贡献总结如下:
- 我们定义了一个新颖的研究问题:冷启动POI签到预测,旨在通过建模新引入POI的时间演化及其与附近POI在结构化城市空间背景下的功能交互,来预测其未来的签到模式。这种冷启动预测设定对于真实世界的决策至关重要,但在现有文献中仍未得到充分探索。
- 我们提出了CausalPOI,一个针对此任务量身定制的时空因果表示学习框架。据我们所知,这是第一个通过模拟事实和反事实结果系统地在POI级别纳入因果估计的框架,从而实现了城市分析中的细粒度因果推理。CausalPOI包含两个关键组件:(1)时空功能交互图模块,用于捕捉POI之间的空间邻近性和语义功能关系,使模型能够发现超越单纯地理距离的竞争和互补关系。(2)因果推断模块,基于对齐的处理图和控制图结构来估计新引入POI的个体处理效应。
- 我们利用来自美国的真实世界POI和签到数据,对冷启动POI签到预测进行了广泛的实验。结果证明了CausalPOI在预测引入后POI活动和估计处理效应方面的有效性。与基线方法相比,我们的方法在所有指标上都取得了显著改进。特别地,在最具挑战性的区域,CausalPOI实现了相比最佳基线高达57.8%的RMSE降低和34.3%的MAE降低,展示了其在冷启动条件下的鲁棒性以及捕捉动态城市环境中因果效应的有效性。
## 2. 相关工作
### 2.1. POI签到预测
POI签到预测通常被构架为城市表示学习的一个下游任务,其核心目标是获得信息丰富的区域级嵌入。在这条研究路线中,通常使用POI、轨迹或道路网络构建空间图,然后将生成的嵌入用于需求预测或移动性分析等任务。例如,Fu等人(Fu等,2019)和Zhang等人(Zhang等,2019)建模空间自相关和区域内结构以支持区域级签到预测。更近期的研究,包括Wu等人(Wu等,2022)和Zhang等人(Zhang等,2023),通过基于图的融合或对比学习技术纳入异构空间信号,进一步增强了区域表示。Li等人(Li等,2020)也通过分析竞争关系研究了POI交互,强调了功能依赖关系在POI行为建模中的重要性。
然而,这些方法主要关注区域抽象,可能会忽略单个POI的细微动态。通过将签到预测表述为区域层面的统计聚合,它们常常无法捕捉特定POI的演化模式——例如时间爆发、局部趋势或功能变化。少数研究尝试直接对POI建模。例如,Tschernutter等人(Tschernutter和Feuerriegel,2021)通过建模POI之间的潜在交互来预测POI级别的签到量。尽管如此,这些模型通常假设POI行为是静态的,缺乏捕捉时间演化或局部上下文结构性变化的能力。
### 2.2. 因果建模
传统的POI预测模型主要依赖于时空数据中观察到的统计相关性,这限制了它们揭示因果效应的能力——尤其是在反事实场景中,例如评估添加或移除POI的影响。为了克服这些限制,因果表示学习最近受到了关注。开创性工作如TARNet和CFRNet(Shalit等,2017),以及DragonNet(Shi等,2019),利用潜在结果框架通过学习减少混淆偏差的表示来估计ITE。然而,这些方法主要针对表格或序列数据设计,不适用于结构化空间领域。
与此同时,基于图的因果推断已成为关系型数据的一个有前景的方向。例如,CausalGNN(Wang等,2022)提出通过将干预建模与消息传递相结合来学习静态图上的因果表示,而HyperSCI(Ma等,2022)将此工作扩展到高阶关系结构。然而,这类方法通常假设固定的图拓扑,缺乏处理动态空间结构的机制,而这在城市环境中很常见。此外,它们通常忽略空间依赖关系的时间演化以及POI等城市实体的功能语义。
## 3. 预备知识
**定义1(兴趣点)**:一个POI \(p\) 指的是具有地理位置的兴趣点,\(p.g = (lat_p, lon_p)\)。它可以关联一组文本标签 \(p.t = (t_1, t_2, ..., t_i)\)。
**定义2(POI签到序列)**:每个POI \(p\) 都有一个签到序列 \(p.c = \{c_1, c_2, ..., c_W\}\),其中每条签到记录表示为一个元组 \(c = (w, n)\),指示POI \(p\) 在第 \(w\) 周被访问了 \(n\) 次。POI和签到序列的示例见附录A(表4)。
**问题陈述**:我们正式定义**冷启动POI签到预测**问题如下:给定一个没有历史签到记录的新引入POI \(p\),目标是:(1)预测其未来 \(W\) 周的签到序列 \(\hat{p}.c = \{\hat{c}_1, \hat{c}_2, ..., \hat{c}_W\}\);(2)通过比较事实场景(引入 \(p\))和反事实场景(未引入 \(p\))下的预测结果,估计引入 \(p\) 的个体处理效应(ITE)。在训练和评估期间,真实未来签到序列 \(p.c = \{c_1, c_2, ..., c_W\}\) 是可用的。相似文章
基于图信息流匹配的时空插补
GiFlow 是一个用于时空插补的图信息流匹配框架,它用图信息先验取代高斯先验,并使用结合了空间注意力、时间注意力和时空传播的混合向量场模型。在合成数据集和真实世界数据集上均优于现有最先进方法。
三思而后行:意图引导推理用于基于LLM的位置预测
IntentPOI是一个两阶段意图引导推理框架,用于下一个POI预测。它首先从历史移动模式、同伴行为和时间上下文中推断用户意图,然后选择与这些意图一致的位置,在十一个最先进的基线方法中表现最优。
MOSAIC:通过稀疏可加可识别因果学习在科学时间序列中进行模块发现
本文介绍了 MOSAIC,这是一种用于科学时间序列中模块发现的方法,它将因果表征学习与稀疏可加可识别因果学习相结合。其目标是在无需事后对齐的情况下,恢复可解释的潜在变量及其关联观测值,并在分子动力学和气候数据等领域进行了验证。
用于交通预测的全局-局部图注意力网络
提出了一种具有成对编码和基于事件的邻接矩阵的全局-局部图注意力网络(GLGAT)用于交通预测,有效捕捉时空相关性,并在真实数据集上取得了有竞争力的性能。
用于交通预测的图条件图神经网络专家混合模型
提出了GC-MoE,一种用于交通预测的图条件专家混合框架,该框架根据图拓扑和近期输入为每个节点分配个性化的冻结预训练时空图神经网络专家组合,仅训练一个轻量级路由模块(约1.7万个参数),并在四个基准数据集上取得了有竞争力的性能。