通过逆最优运输从起讫点流中学习城市出行成本

arXiv cs.LG 论文

摘要

本文介绍了两种逆最优运输估计器,从观测到的起讫点流中恢复潜在的选择成本,并应用于菲律宾学校选择数据,以量化教育补贴抵消了多少感知出行成本。

arXiv:2606.14157v1 公告类型:新 摘要:城市通过混合的公共-私营设施网络提供基本服务,包括学校、诊所、交通服务商和补贴服务点。在这些系统中,规划者通常观察到家庭的出行去向,但无法观察到潜在的成本函数——家庭通过该函数权衡距离、价格和机构准入等因素。我们通过菲律宾的学校选择问题来研究这一城市问题,该国最大的国家教育补贴旨在将学生从拥挤的公立学校引导至参与该计划的私立学校。将学校间的入学流视为熵最优运输方案,我们使用两种互补的逆最优运输模型恢复潜在的选择成本:一种带有补贴项的可解释距离分层模型,以及一种通过可微分Sinkhorn前向传播训练的神经成本模型。将该框架应用于该国人口最多地区23,820条观测流中的283,016次学生出行,我们估计出一个补贴等效距离$\lambda^{(k)}$,解释为补贴所抵消的感知出行成本(以公里计)。该案例展示了如何将行政起讫点数据转化为可解释的规划指标,用于考虑可达性的补贴设计、设施选址和城市服务分配。
查看原文
查看缓存全文

缓存时间: 2026/06/15 09:11

# 通过逆最优传输从出行起讫流中学习城市出行成本
来源:https://arxiv.org/html/2606.14157

###### 摘要

城市通过公私混合设施网络(包括学校、诊所、交通服务提供商和补贴服务点)提供基本服务。在这些系统中,规划者通常能观察到家庭的出行目的地,却无法获知家庭在权衡距离、价格和机构可及性等因素时所依据的潜在成本函数。我们以菲律宾的学校选择为案例研究这一城市问题——该国的最大国家教育补贴旨在将学生从拥挤的公立学校引导至参与的私立学校。将学校间的入学流视为熵正则化最优传输方案,我们通过两种互补的逆最优传输模型恢复潜在的选择成本:一种是包含补贴项的可解释的分距离段模型,另一种是通过可微Sinkhorn前向传播训练的神经成本模型。将模型应用于人口最稠密地区283,016次学生出行(涉及23,820条观测流)后,该框架估计出补贴等效距离 \lambda^{(k)},即补贴所抵消的感知出行成本公里数。该案例展示了如何将行政起讫数据转化为可解释的规划指标,用于可及性感知的补贴设计、设施选址和城市服务分配。

## 1  引言

许多城市服务通过公立和私立机构的混合网络提供。教育、医疗和社会服务越来越依赖补贴和分散的设施,要求家庭在空间不均等的选项中进行选择。在此类系统中,可及性不仅取决于名义价格或与最近设施的距离,还取决于一个潜在成本函数——家庭通过该函数权衡距离、可负担性和机构质量。然而,规划者通常能观测到最终的起讫流,却无法得知产生这些流的决策成本曲面。

学校选择是该问题的具体实例。在菲律宾,最大的国家教育补贴计划资助参与计划的私立初中入学,部分目的是缓解过度拥挤的公立学校的拥堵。然而,只有当补贴使其负担得起的学校在空间上也可达时,补贴才能真正缓解公立系统压力。现有方法使用前向重力模型或离散选择模型对流动进行建模[6](https://arxiv.org/html/2606.14157#bib.bib6),这些模型对预测有效,但无法直接回答规划者关心的核心问题:*一笔补贴能买来多少公里的感知可及性?这个数值在不同空间模式下是否有变化?*

我们通过逆最优传输(OT)来填补这一空白。给定观测到的学校间流,我们恢复使这些流合理的成本函数,并将恢复的成本转化为政策相关的补贴覆盖度量。本文有三方面贡献。首先,我们引入两种互补的逆OT估计器:一种包含明确补贴项的可解释分段距离成本模型,另一种通过可微Sinkhorn前向传播训练的神经成本模型。其次,我们以菲律宾大规模学校选择流为案例,展示该框架在公私混合服务网络中补贴介导的可及性问题上的应用。第三,我们推导出补贴等效距离 \lambda^{(k)},它衡量在每个距离段中补贴抵消了多少公里的感知出行成本——这是一个可直接用于补贴校准、设施布局和可及性感知服务分配的指标。

## 2  方法与数据

参见图表说明图 1:恢复的距离-成本敏感性。水平线段显示分段MAP估计值;神经曲线显示补贴为零、中位数正补贴(9,000比索)和最大补贴(13,000比索)时的 \frac{dc}{dd}。神经模型拟合度提升了13.7%,并显示出短程距离-补贴相互作用,而非陡峭的长程阈值。

设 T_{\mathrm{obs}} 为观测到的学校间学生流动矩阵,归一化为一个传输方案,其出行边际为 \mathbf{p},到达边际为 \mathbf{q}。给定成本矩阵 C,前向模型为熵正则化OT解:

\hat{T} = \operatorname{Sinkhorn}(\mathbf{p},\mathbf{q},C,\varepsilon), \quad \varepsilon = 0.1.

逆问题估计使得下式最小的成本函数:

\Phi = \frac{\|T_{\mathrm{obs}} - \hat{T}\|_F^2}{2\sigma^2}.

我们估计两种互补的成本模型。第一种是可解释的分段模型:

c_{ij} = \theta_d^{(k(d_{ij}))} d_{ij} + \theta_e e_j,

其中 d_{ij} 是路网距离,e_j 是目的地的补贴金额(千比索),k(d_{ij}) 索引0-5公里、5-15公里、15-50公里三个距离段。策略相关量为:

\lambda^{(k)} = -\frac{\theta_e}{\theta_d^{(k)}},

解释为每增加1,000比索补贴所抵消的感知出行成本公里数。第二种模型是神经成本函数 c_{ij} = f_w(d_{ij}, e_j),通过反向传播经过可微Sinkhorn算子进行估计。

案例研究使用菲律宾教育部2022-2024学年在人口最密集地区的数据。我们将个人记录汇总为学校间OD流,并将目的地与学校坐标、路网距离和补贴金额关联。工作矩阵包含4,200所出发学校、1,861所目的地学校、1,852,177个50公里以内的可行OD对,以及23,820个观测到的正OD对,代表283,016次学生出行。所有流均为汇总数据,无法识别单个学生。

## 3  初步结果

分段模型通过GPU加速的最大后验(MAP)优化进行估计,使用对数域Sinkhorn前向传播。似然尺度经过校准,使初始参数设置下 \Phi = 5.00;分段MAP模型将其降至 \Phi(\theta_{\mathrm{MAP}}) = 3.29。估计系数为 \theta_d^{(1)} = 0.185,\theta_d^{(2)} = 0.163,\theta_d^{(3)} = 0.994,\theta_e = -0.989。这些系数意味着补贴等效距离为 \lambda^{(1)} = 5.35 公里、\lambda^{(2)} = 6.07 公里、\lambda^{(3)} = 1.00 公里(每1,000比索)。例如,在5-15公里距离段,每增加1,000比索补贴可抵消约6.07公里的感知出行成本;补贴使更远的学校在恢复的选择成本函数中显得更近——这并不意味着学生实际出行距离减少。

神经逆OT模型改进了拟合度,达到 \Phi(w^*) = 2.84,比分段模型降低13.7%。图1(https://arxiv.org/html/2606.14157#S2.F1)比较了分段系数与神经距离导数 \frac{dc}{dd}(分别在补贴为零、中位数正补贴9,000比索和最大补贴13,000比索时)。在零补贴时,神经距离敏感性平滑且较低,范围为0.083至0.196。在中位数正补贴下,范围为0.083至0.736;在最大补贴下,范围为0.080至0.612。在两种有补贴情况下,最大值出现在极短距离处,在中长距离上趋于平坦。

这些结果说明了双模型设计的重要性。分段模型提供了可解释的规划指标 \lambda^{(k)},而神经模型揭示了更精细的距离-补贴相互作用。特别是,神经导数并未重现15-50公里宽距离段所暗示的陡峭长程增长,这表明某些表面上的长程摩擦可能源于距离段聚合。

## 4  讨论及对城市系统的影响

核心规划启示是:补贴具有空间足迹。其效果不仅取决于名义金额,还取决于受补贴设施相对于需求的位置,以及家庭在网络不同区域对距离的敏感程度。在菲律宾学校选择案例中,统一补贴可能因此产生不平等的可及性增益:在参与学校邻近区域有效,而在受补贴容量与拥挤公立学校学区空间错配的区域效果较弱。

该框架可推广至教育以外的领域。医疗设施选择、公共交通出行、补贴住房搜索、市场可达性和疏散行为均可表示为具有潜在空间摩擦的OD矩阵。逆OT提供了一种可复用的城市AI方法,用于从行政流动数据中学习可解释的行为成本,支持补贴设计、设施选址、容量分配和可及性感知的公共服务规划。

## 参考文献

- [1] A. Anas, “Discrete choice theory, information theory and the multinomial logit and gravity models,” *Transportation Research Part B*, vol. 17, no. 1, pp. 13–23, 1983.
- [2] M. Cuturi, “Sinkhorn distances: Lightspeed computation of optimal transport,” in *NeurIPS*, 2013.
- [3] A. M. Stuart and M.-T. Wolfram, “Inverse optimal transport,” *SIAM Journal on Applied Mathematics*, vol. 80, no. 1, pp. 599–619, 2020.
- [4] G. Peyré and M. Cuturi, “Computational optimal transport,” *Foundations and Trends in Machine Learning*, vol. 11, no. 5–6, pp. 355–607, 2019.
- [5] P. A. Pathak and P. Shi, “How well do structural demand models work? Counterfactual predictions in school choice,” *Journal of Econometrics*, vol. 215, no. 2, pp. 687–721, 2020.
- [6] S. Bundoc, P. Martinez, S. Ibañez, E. Legara, “Student flow modeling for school decongestion via stochastic gravity estimation and constrained spatial allocation,” in *Proceedings of the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD ’26)*, Jeju, Korea, 2026.

相似文章

基于最优传输势的多边缘流匹配

arXiv cs.LG

提出OTP-FM,一种新颖的多边缘流匹配方法,利用最优传输势来软性地引导流通过中间边缘分布,在单细胞RNA测序、海洋学和气象学数据集上实现了最先进的性能。

一个基于最优传输理论的在线增量学习潜在空间培育方法

Hugging Face Daily Papers

本文介绍了MMOT,一种基于最优传输理论的在线混合模型学习框架,通过动态质心更新和改进的类别相似性估计来应对分布漂移下的增量学习。该方法包含一种动态保持策略,用于缓解灾难性遗忘并在潜在空间中维持类别可分离性。

DOT-MoE:面向MoE化的可微最优传输

Hugging Face Daily Papers

DOT-MoE将密集层分解形式化为可微最优传输问题,能够高效训练稀疏MoE模型,在将活跃参数减少50%的同时保留原始模型90%的性能。