ReTAMamba:用于不规则临床时间序列预测的可靠性感知时间聚合与Mamba方法
摘要
提出ReTAMamba,一种使用基于Mamba的可靠性感知时间聚合进行不规则临床时间序列预测的方法,在MIMIC-IV、eICU和PhysioNet 2012上取得了显著的AUPRC提升。
arXiv:2605.16380v1 公告类型:新
摘要:临床时间序列数据难以用为规则序列设计的方法建模,因为它们表现出不规则采样、频繁缺失值以及变量间异质的观察模式。现有方法通常使用观察掩码和时间间隔信息,但未能持续捕捉过去观察的衰减可靠性,也未能在聚合过程中在一致的时间上下文中组织多分辨率信息。为解决这些限制,我们提出了基于可靠性感知时间聚合的Mamba(ReTAMamba),该方法将临床时间序列重构为时变令牌序列,从缺失性和经过时间估计观察可靠性,并用统计描述符增强区间摘要。使用时间编织在一致的时间上下文中整合短期和长期时间信息,并应用预算令牌路由器来约束序列长度同时保留信息性摘要。在MIMIC-IV、eICU和PhysioNet 2012上的实验表明,ReTAMamba在强基线上一致地提升了AUPRC,平均相对增益分别为7.51%、7.80%和10.15%。eICU上的队列水平和患者水平分析进一步显示,对于更动态的信号(如心率和血压),学习到的平均衰减比相对静态的信号(如实验室检验变量)大24.3%。这些发现表明,在不规则临床时间序列中进行有效预测不仅需要建模测量了什么,还需要建模何时以及如何观察到的,包括信息新鲜度和观察及时性。
查看缓存全文
缓存时间: 2026/05/19 06:42
# ReTAMamba:面向不规则临床时间序列预测的基于Mamba的可靠性感知时间聚合
来源:https://arxiv.org/html/2605.16380
\(2026\)
###### 摘要。
临床时间序列数据因其不规则的采样、频繁的缺失值以及不同变量间异构的观测模式,难以用针对规则序列设计的方法进行建模。现有方法通常使用观测掩码和时间间隔信息,但在聚合过程中,既未能持续捕捉过往观测的衰减可靠性,也未能将多分辨率信息在一个连贯的时间上下文内进行一致性组织。为解决这些局限性,本文提出基于Mamba的可靠性感知时间聚合方法(ReTAMamba),该方法将临床时间序列重构为时变令牌序列,从缺失性和经过时间中估计观测可靠性,并用统计描述符增强时间区间摘要。采用时间顺序编织方法将短期和长期时间信息集成到连贯的时间上下文中,并应用预算令牌路由器,在保留信息摘要的同时约束序列长度。在MIMIC-IV、eICU和PhysioNet 2012上的实验表明,ReTAMamba在AUPRC指标上持续优于强基线,平均相对增益分别达到7.51%、7.80%和10.15%。在eICU上的队列级和患者级分析进一步显示,对于动态性更强的信号(如心率和血压),学习到的平均衰减值比相对静态的信号(如实验室检验变量)大24.3%。这些发现表明,在不规则临床时间序列中进行有效预测,不仅需要建模测量了什么,还需要建模何时以及如何观测到的,包括信息的新鲜度和观测的及时性。
不规则临床时间序列,死亡率预测,可靠性感知建模,多尺度时间聚合,Mamba
††版权:无††期刊年份:2026††出版月份:11
## 1. 引言
通过电子健康记录(EHR)系统的广泛采用所收集的临床时间序列数据,已成为刻画患者生理状态变化的关键信息来源,并在严重程度评估、风险预测和早期临床决策支持中发挥着重要作用(Pungitore and Subbian, 2023 (https://arxiv.org/html/2605.16380#bib.bib1); Ma et al., 2019 (https://arxiv.org/html/2605.16380#bib.bib2))。这在重症监护病房(ICU)中尤为关键,因为患者病情可能迅速变化,使得在入院最初24-48小时内准确预测院内死亡率等结局成为一项重要任务(Harutyunyan et al., 2019 (https://arxiv.org/html/2605.16380#bib.bib3))。
与规则时间序列不同,临床时间序列本质上是非规则且稀疏的:不同变量的测量频率各异,在给定时间点可能仅观测到部分变量,且测量间隔极不均匀(Ghassemi et al., 2015 (https://arxiv.org/html/2605.16380#bib.bib4))。此外,缺失不仅仅是信息的缺失,它可能反映观测过程和临床决策,从而成为信息性缺失(Che et al., 2018 (https://arxiv.org/html/2605.16380#bib.bib5))。因此,临床时间序列预测不仅需要对观测值进行建模,还需要对观测结构(包括测量了哪些变量以及何时测量)以及随上次观测后时间推移所导致的信息新鲜度进行建模。
因此,先前的研究已转向联合建模非规则观测结构、缺失的含义以及跨多个分辨率的时间上下文。早期方法主要通过每小时聚合或前向插值来正则化数据,然后应用通用模型,但此类方法未能保留嵌入在原始观测模式中的临床上下文(Lipton et al., 2015 (https://arxiv.org/html/2605.16380#bib.bib6))。后来的研究试图更直接地建模非规则采样,要么通过在参考时间点插值非规则观测,要么将其展开为事件序列(Shukla and Marlin, 2019 (https://arxiv.org/html/2605.16380#bib.bib7); Zhang et al., 2021 (https://arxiv.org/html/2605.16380#bib.bib8))。然而,这些方法难以同时处理观测频率的跨变量异质性、长序列处理的计算负担以及临床观测结构的复杂性(Horn et al., 2020 (https://arxiv.org/html/2605.16380#bib.bib9))。由于临床时间序列中的缺失通常表现为信息性缺失,近期的方法越来越强调缺失本身的意义以及信息随时间推移的有效性(Che et al., 2018 (https://arxiv.org/html/2605.16380#bib.bib5))。此外,准确评估患者状态需要时间聚合和多尺度建模,以捕捉短期生理变化和长期疾病轨迹(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。尽管如此,这些研究并未充分解决如何在表示学习过程中一致地整合观测信号的可靠性,或者如何在沿真实时间轴线对齐不同时间分辨率生成的信息的同时,有效控制由此产生的序列长度增长(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。
为解决这些挑战,本文提出了一种统一框架——基于Mamba的可靠性感知时间聚合(ReTAMamba),用于将非规则临床时间序列建模为可靠性感知的多尺度序列。ReTAMamba将非规则多变量记录表示为时变令牌序列,保留特定变量的观测间隔和缺失模式,而不将其压缩为传统的基于聚合的输入。然后从缺失性和经过时间中估计随时间变化的观测可靠性,将此可靠性纳入多分辨率时间聚合,并通过时间顺序编织重新排序来自不同时间分辨率的摘要令牌。最后,在Mamba编码之前应用预算令牌路由(训练时使用软路由,推理时使用硬top-k选择)。通过这种设计,ReTAMamba在单个预测框架内联合建模了观测结构、信息可靠性、时效性、多尺度时间上下文以及预算序列压缩。
主要贡献如下:
- • 提出一个统一的令牌序列框架用于不规则临床时间序列,相比传统基于聚合的表示,更直接地保留了稀疏观测结构和特定变量的缺失模式。
- • 引入一种可靠性感知的时间聚合机制,该机制根据特定变量的衰减,从缺失性和经过时间中持续估计观测有效性,并将其纳入多分辨率摘要的构建中。
- • 开发一种以时间顺序编织为中心的多尺度序列建模策略,该策略以时间排序的方式重新排列来自不同时间分辨率的时间区间摘要,并在序列编码之前结合预算令牌路由(训练时使用软路由,推理时使用硬top-k选择)。
本文其余部分组织如下:第2节回顾相关工作,第3节描述提出的ReTAMamba架构,第4节介绍实验设置和结果,第5节总结全文。
## 2. 相关工作
### 2.1. 不规则临床时间序列建模
关于非规则采样时间序列的早期研究主要通过每小时聚合或前向插值来正则化数据,但此类方法因丢弃了嵌入在观测模式中的有意义的临床上下文而受到批评(Lipton et al., 2015 (https://arxiv.org/html/2605.16380#bib.bib6))。后来的工作尝试通过修改RNN状态更新或引入时间感知注意力来直接学习采样不规则性(Che et al., 2018 (https://arxiv.org/html/2605.16380#bib.bib5); Shukla and Marlin, 2021 (https://arxiv.org/html/2605.16380#bib.bib11))。然而,这些方法仍然难以解决观测频率的跨变量巨大差异,即所谓的序列间差异(Horn et al., 2020 (https://arxiv.org/html/2605.16380#bib.bib9))。更近期的方法主要沿两个方向展开:基于插值的方法,如IP-Nets(Shukla and Marlin, 2019 (https://arxiv.org/html/2605.16380#bib.bib7))和mTAN(Shukla and Marlin, 2021 (https://arxiv.org/html/2605.16380#bib.bib11)),将非规则观测映射到预定义的参考时间点;以及基于展开的方法,如SeFT(Horn et al., 2020 (https://arxiv.org/html/2605.16380#bib.bib9)),直接将数据表示为\(值, 变量, 时间\)元组序列。基于插值的方法在固定参考点强制合并信息,限制了其联合捕捉细粒度和粗粒度时间模式的能力(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。基于展开的方法被证明能更忠实地保留原始观测模式,但在ICU中,数十个生理变量被长时间监测,观测结果表明序列长度随观测数量快速增长,在具有\(O(L^2)\)复杂度的基于Transformer的架构中造成巨大的内存开销和计算瓶颈,阻碍了实时临床决策支持(Vaswani et al., 2017 (https://arxiv.org/html/2605.16380#bib.bib12))。最近,线性复杂度的状态空间模型如Mamba(Gu and Dao, 2024 (https://arxiv.org/html/2605.16380#bib.bib13))作为大规模序列建模的有前景的替代方案出现,但如何将其与极度不平衡和缺失的临床观测结构有效集成仍然是一个重要挑战。
### 2.2. 可靠性感知建模
与规则时间序列不同,临床时间序列具有特定变量的测量间隔,缺失本身可能表现为由临床决策塑造的信息性缺失(Groenwold, 2020 (https://arxiv.org/html/2605.16380#bib.bib14); Tan et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib15))。早期方法如GRU-D(Che et al., 2018 (https://arxiv.org/html/2605.16380#bib.bib5))使用观测掩码和时间间隔来建模信息衰减,而更近期的方法如Raindrop(Zhang et al., 2021 (https://arxiv.org/html/2605.16380#bib.bib8))则使用图结构来学习异步观测之间的交互。然而,这些方法仍然难以在结构上一致地处理观测信号之间的频率差异及其随时间变化的效度(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。在实践中,快速变化的变量(如心率或呼吸频率)与在日尺度上演化的血液检验变量具有根本不同的信息半衰期(Shi et al., 2025 (https://arxiv.org/html/2605.16380#bib.bib16))。因此,尽管这些方法在短期缺失值修正方面有效,但若不能在更深层的表示学习过程中一致地保留观测有效性,仍可能扭曲信息(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。这需要一个框架,以特定变量的连续可靠性来量化过往观测呈指数衰减的有效性。动态控制不确定的缺失信息并将这种基于可靠性的观测结构整合到大规模序列建模中,仍然是一个重要挑战。同时,联合捕捉快速短期生理变化和长期疾病轨迹的需求,凸显了多尺度分析在临床时间序列建模中的重要性(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。
参见图注图1. ReTAMamba的详细架构。
### 2.3. 多尺度建模
在EHR研究中,从分钟级的生理变化到多天的疾病轨迹,捕捉多个时间分辨率下的患者状态,对于准确的预后预测至关重要(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10))。近期的努力已将多尺度机制纳入通用模型(如Transformer),但这些模型主要针对规则采样数据设计,在稀疏、不规则的临床环境中效率低下(Horn et al., 2020 (https://arxiv.org/html/2605.16380#bib.bib9); Vaswani et al., 2017 (https://arxiv.org/html/2605.16380#bib.bib12))。也已提出专门针对临床不规则性的多尺度架构,包括Warpformer(Zhang et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib10)),但它们仍然独立构建分辨率特定的摘要或以并行方式组合这些摘要。此外,由于采样率和测量精度的差异,临床信号 inherently 表现出时间错位(Zhang et al., 2021 (https://arxiv.org/html/2605.16380#bib.bib8); Lee et al., 2025 (https://arxiv.org/html/2605.16380#bib.bib17))。基于DTW的对齐方法已被研究用于解决此问题,但大多数方法局限于规则时间序列之间的回顾性匹配,因此不适合具有实时推理的因果建模(Sakoe and Chiba, 1978 (https://arxiv.org/html/2605.16380#bib.bib18); Senin, 2008 (https://arxiv.org/html/2605.16380#bib.bib19))。因此,在不规则临床时间序列中支持多分辨率学习,需要的不仅仅是并行的多尺度摘要。它需要一个能够持续考虑时变可靠性、沿时间轴组织跨尺度摘要并有效控制序列长度的框架。相关研究还探索了互补方向,例如高效循环架构、自监督表示学习和替代序列表示(Joshi and Hauskrecht, 2025 (https://arxiv.org/html/2605.16380#bib.bib30); Liu et al., 2026 (https://arxiv.org/html/2605.16380#bib.bib31); Li et al., 2023 (https://arxiv.org/html/2605.16380#bib.bib32)),进一步凸显了在不规则观测模式下进行可扩展且结构感知学习的必要性。
## 3. 提出模型
图1 (https://arxiv.org/html/2605.16380#S2.F1) 展示了ReTAMamba的整体架构。每个输入样本由数值 \(X \in \mathbb{R}^{L \times V}\)、观测掩码 \(m \in \{0,1\}^{L \times V}\)、测量时间 \(t \in \mathbb{R}^L\) 和时间间隔 \(\Delta \in \mathbb{R}_{\geq 0}^{L \times V}\) 组成,其中 \(\Delta\) 表示自每个变量上次观测以来经过的时间。这里,\(L\) 和 \(V\) 分别表示序列长度和变量数量。ReTAMamba将这个不规则多变量时间序列转换为一个可靠性感知的多尺度令牌序列以进行预测。它首先将输入重构为与观测结构对齐的时变令牌序列,然后在持续估计的观测可靠性下,将令牌化的观测聚合到多个时间分辨率中,最后在序列编码之前将生成的摘要压缩到固定预算下。通过这个过程...相似文章
PIMSM: 物理信息驱动的多尺度Mamba:分布偏移下稳定的神经表示
本文提出物理信息驱动的多尺度Mamba(PIMSM),这是一种状态空间架构,它将模型记忆与物理时间尺度对齐,以提升在科学时间序列分布偏移下的鲁棒性,并在fMRI和天气预报任务上展示了改进。
预测中期阿尔茨海默病进展:基于ADNI临床和生物标志物历史数据实现24个月CDR-SB变化的残差间隙感知变换器
本文提出了一种残差间隙感知变换器,将混合效应统计参考与基于变换器的残差学习相结合,利用ADNI临床和生物标志物历史数据预测24个月CDR-SB变化,在均方误差和相关性上均优于基线模型。
RAG4Outcome: 一种用于慢性骨髓炎预后预测的检索增强多模态框架
提出RAG4Outcome,一种整合多模态临床数据(PET-CT报告、手术记录、随访笔记)的检索增强生成框架,用于改善慢性骨髓炎的预后预测,增强可解释性和临床可靠性。
EnergyMamba:一种面向能源消耗预测的、具有不确定性意识的图增强选择性状态空间模型
EnergyMamba提出了一种新颖的时空框架,将图增强选择性状态空间模型与自适应共形分位数回归相结合,实现准确可靠的能源消耗预测并给出不确定性估计,在佛罗里达、纽约和加利福尼亚的真实数据集上取得了性能提升。
用于离策略时序差分预测的行为感知辅助修正
本文提出用于离策略时序差分预测的行为感知辅助修正,引入了BA-TDC和BA-TDRC算法,这些算法用行为贝尔曼矩阵替代辅助协方差矩阵,以提高稳定性和收敛性。理论分析和在标准基准上的实验验证了所提方法的有效性。