基于非参数生存分析的快速变化点检测器准确评估

arXiv cs.LG 论文

摘要

本文提出非参数估计器 KM-ARL 和 KM-ADD,用于在有限和不规则序列长度下评估变化点检测器,并将快速变化点检测(QCD)与生存分析进行类比。

arXiv:2605.18798v1 公告类型:新 摘要:我们提出了非参数估计器,用于在有限和不规则序列长度下快速变化点检测(QCD)中的平均运行长度(ARL)和平均检测延迟(ADD)。尽管 ARL 和 ADD 在理论和模拟研究中被广泛用作最优性准则,但它们在实际数据集中的应用受到序列长度有限和不规则的阻碍。为了解决这一问题,我们通过将 QCD 与生存分析进行类比,提出了 ARL 和 ADD 的非参数估计器,称为 KM-ARL 和 KM-ADD,用于建模序列截断下的检测概率。我们推导了估计偏差的界限,并证明除非需要外推,否则这些估计器是渐近无偏的。在模拟和真实数据集上的实验展示了它们的实际效用,增强了对有限和不规则序列长度的鲁棒性,提高了可解释性,并促进了经验性、直观的模型选择。我们的 Python 代码可在 https://github.com/TaikiMiyagawa/Kaplan-Meier-Average-Run-Length 获取,为从业人员提供了即用型实现。
查看原文
查看缓存全文

缓存时间: 2026/05/20 08:35

# 通过非参数生存分析对最快变化检测器的准确评估
来源: https://arxiv.org/abs/2605.18798
查看PDF (https://arxiv.org/pdf/2605.18798)

> 摘要: 我们针对有限且不规则序列长度下的最快变化检测问题,提出了平均运行长度(ARL)和平均检测延迟(ADD)的非参数估计量。尽管ARL和ADD在理论和仿真研究中被广泛用作最优性准则,但将其应用于真实世界数据集时,常因序列长度有限且不规则而受阻。为解决此问题,我们通过将快速变化检测与生存分析进行类比,对序列截断下的检测概率建模,从而提出了ARL和ADD的非参数估计量,分别称为KM-ARL和KM-ADD。我们推导了估计偏差界,并证明除非需要进行外推,否则这些估计量是渐近无偏的。在模拟和真实世界数据集上的实验展示了其实用价值:增强了对于有限且不规则序列长度的鲁棒性,改善了可解释性,并促进了经验性的、直观的模型选择。我们的Python代码可在以下网址获取:this https URL (https://github.com/TaikiMiyagawa/Kaplan-Meier-Average-Run-Length),为实践者提供了即用型实现。

## 提交历史

来自:Taiki Miyagawa \[查看邮件 (https://arxiv.org/show-email/ca4d58af/2605.18798)\] **\[v1\]** 2026年5月11日星期一 07:23:48 UTC (1,659 KB)

相似文章