基于非参数生存分析的快速变化点检测器准确评估
摘要
本文提出非参数估计器 KM-ARL 和 KM-ADD,用于在有限和不规则序列长度下评估变化点检测器,并将快速变化点检测(QCD)与生存分析进行类比。
arXiv:2605.18798v1 公告类型:新
摘要:我们提出了非参数估计器,用于在有限和不规则序列长度下快速变化点检测(QCD)中的平均运行长度(ARL)和平均检测延迟(ADD)。尽管 ARL 和 ADD 在理论和模拟研究中被广泛用作最优性准则,但它们在实际数据集中的应用受到序列长度有限和不规则的阻碍。为了解决这一问题,我们通过将 QCD 与生存分析进行类比,提出了 ARL 和 ADD 的非参数估计器,称为 KM-ARL 和 KM-ADD,用于建模序列截断下的检测概率。我们推导了估计偏差的界限,并证明除非需要外推,否则这些估计器是渐近无偏的。在模拟和真实数据集上的实验展示了它们的实际效用,增强了对有限和不规则序列长度的鲁棒性,提高了可解释性,并促进了经验性、直观的模型选择。我们的 Python 代码可在 https://github.com/TaikiMiyagawa/Kaplan-Meier-Average-Run-Length 获取,为从业人员提供了即用型实现。
查看缓存全文
缓存时间: 2026/05/20 08:35
# 通过非参数生存分析对最快变化检测器的准确评估 来源: https://arxiv.org/abs/2605.18798 查看PDF (https://arxiv.org/pdf/2605.18798) > 摘要: 我们针对有限且不规则序列长度下的最快变化检测问题,提出了平均运行长度(ARL)和平均检测延迟(ADD)的非参数估计量。尽管ARL和ADD在理论和仿真研究中被广泛用作最优性准则,但将其应用于真实世界数据集时,常因序列长度有限且不规则而受阻。为解决此问题,我们通过将快速变化检测与生存分析进行类比,对序列截断下的检测概率建模,从而提出了ARL和ADD的非参数估计量,分别称为KM-ARL和KM-ADD。我们推导了估计偏差界,并证明除非需要进行外推,否则这些估计量是渐近无偏的。在模拟和真实世界数据集上的实验展示了其实用价值:增强了对于有限且不规则序列长度的鲁棒性,改善了可解释性,并促进了经验性的、直观的模型选择。我们的Python代码可在以下网址获取:this https URL (https://github.com/TaikiMiyagawa/Kaplan-Meier-Average-Run-Length),为实践者提供了即用型实现。 ## 提交历史 来自:Taiki Miyagawa \[查看邮件 (https://arxiv.org/show-email/ca4d58af/2605.18798)\] **\[v1\]** 2026年5月11日星期一 07:23:48 UTC (1,659 KB)
相似文章
将数据驱动预测与分配对齐:一种以决策为中心的生存分析方法
本文介绍了一种面向决策的生存分析学习方法,该方法通过NDCG优化将预测模型与后续分配决策对齐。应用于美国心脏移植数据后,排名性能提升了50-100%,每年可能带来数千额外生命年。
CKD风险预测中的校准、不确定性沟通与部署就绪:一项框架评估研究
本研究评估了五种用于慢性肾脏病风险预测的机器学习分类器,发现近乎完美的内部性能在分布偏移下失效。强调在临床部署前需要校准稳定性和共形覆盖迁移。
CALAD: 通道感知对比学习用于多变量时间序列异常检测
提出了CALAD,一个用于多变量时间序列异常检测的通道感知对比学习框架,该框架利用估计的通道相关性构建对比样本,实现了最先进的性能。
基于智能体评估与稳定性感知排序的多模态大语言模型鲁棒检查点选择
本文解决了评估不确定性下多模态大语言模型的鲁棒检查点选择挑战,提出了一个多阶段框架,整合了精心策划的真实世界数据、基于LLM的判断以及带有置信度估计的排序协议。
Cascade-KDE:分布外脉冲干扰下的鲁棒时间序列修复
提出Cascade-KDE,一种无需训练的框架,利用二维核密度估计和截断期望来修复被分布外脉冲异常值污染的时间序列,同时保留局部结构和导数特征。