DTVEM-RE:面向密集纵向数据个体特异性多滞后估计的差分时变效应模型的层次随机效应扩展

arXiv cs.LG 论文

摘要

本文提出了DTVEM-RE,这是差分时变效应模型的层次随机效应扩展,通过Stan中的哈密顿蒙特卡洛方法估计个体特异性的多滞后系数,解决了原始DTVEM假设单一群体水平滞后结构的局限性。模拟和实证结果表明,该方法能够恢复人际方差,并在层次和非层次基线方法上有所改进。

arXiv:2606.14116v1 公告类型: 新论文 摘要: Jacobson等人(2019)提出的差分时变效应模型(DTVEM)是一种在密集纵向数据中寻找最佳时间滞后的流行工具,但它假设所有个体共享相同的滞后结构。原作者将修复这一问题列为未来工作,而这与现代临床研究的前提——个体存在差异——相冲突。我们提出了DTVEM-RE,这一扩展允许每个个体拥有自己的滞后系数,并包含确认步骤的两个版本:一个是在Stan中实现的离散时间层次贝叶斯VAR模型,它整合了来自不同个体的信息并提供校准的不确定性;另一个是在ctsem中实现的连续时间个体奥恩斯坦-乌伦贝克模型,可直接处理不等间隔的数据点。我们报告了四项结果。一项模拟显示,贝叶斯版本恢复人际变异tau_a的偏差低于0.01,覆盖率达90%至93%。在Fisher等人(2017)的EMA数据集(N=40)上,个体特异性的滞后1效应在三个情绪项目上相差一个数量级,贝叶斯方法和GAMM估计值高度一致(r=0.87至0.92),且DTVEM-RE在四种离散时间方法中提供了最佳的一步超前预测。一个多滞后版本显示,所有九个tau_k值的可信区间均不包含零,且个体间差异最大的滞后在不同项目间变化,这是仅考虑滞后1的方法(如mlVAR)无法检测到的。最后,两个版本在个体特异性滞后1估计上几乎完全一致(r≥0.995),差异仅如收缩所预测。据我们所知,DTVEM-RE是第一个实现个体特异性DTVEM风格滞后检测的方法,并且标准DTVEM是其特例。
查看原文
查看缓存全文

缓存时间: 2026/06/15 09:10

# DTVEM-RE:差分时变效应模型的分层随机效应扩展——用于密集纵向数据中人特定多滞后估计
来源:https://arxiv.org/html/2606.14116

###### 摘要

Jacobson、Chow 和 Newman(2019)提出的差分时变效应模型(DTVEM)已成为识别密集纵向数据中最优滞后结构的广泛应用工具,它将广义可加混合模型(GAMM)的探索阶段与状态空间向量自回归(VAR)的确认阶段相结合。然而,已发表的DTVEM假设所有个体共享单一的群体水平滞后结构,这一局限性被原作者列为未来工作方向,并且与现代精神病理学研究中许多个体化前提相矛盾。我们提出DTVEM-RE,即DTVEM的分层随机效应扩展,通过Stan中的哈密顿蒙特卡洛方法估计具备向群体均值收缩的人特定多滞后系数。我们报告三组结果。首先,一项涵盖四个异质性水平的模拟研究证实,在EMA研究的典型样本量下,群体间方差参数 \\(\\tau\_a\\) 能清晰恢复,绝对偏差低于0.01,可信区间覆盖率为90%至93%。其次,基于Fisher等人(2017)生态瞬时评估数据集(\\(N=40\\) 患有广泛性焦虑和重度抑郁障碍的门诊患者)的三项经验演示表明,人特定的滞后1自回归效应在不同情感项目上相差一个数量级;分层贝叶斯估计与独立GAMM估计的人特定系数高度一致(\\(r=0.87\\) 至 \\(0.92\\));并且DTVEM-RE在四种分层与非分层基线方法中取得了最佳的一步超前预测对数似然和均方根误差(尽管幅度不大)。第三,一项多滞后扩展显示,三个项目中的九个 \\(\\tau\_k\\) 估计值的90%可信区间均排除零,且异质性最大的滞后在不同项目间存在差异。这种多滞后人特定异质性超出了现有分层VAR方法(如mlVAR)仅对滞后1系数估计随机效应的建模范围。我们得出结论:据我们所知,DTVEM-RE是DTVEM风格滞后检测的首个原则性个体化实现,同时保留了标准DTVEM作为固定效应特例。

**关键词:** DTVEM;分层状态空间模型;生态瞬时评估;个体化精神病理学;随机效应;密集纵向数据;情绪与焦虑动态

## 1 引言

### 1.1 临床心理学中的个体化动力学

过去二十年间,个体在心理动力学上存在有意义差异的认识重塑了定量临床研究。Molenaar(2004)通过非遍历性论证形式化了这一关切,表明从人际变异中得出的结论通常无法推广到个体内部动态。这一影响具有方法论上的重要意义:当研究问题涉及个体内部展开的过程时,标准的横截面和基于群体的纵向模型可能会曲解它们本应研究的现象。

支持这一立场的经验证据迅速积累。Fisher等人(2017)在一项40名患有广泛性焦虑障碍(GAD)、重度抑郁障碍(MDD)或两者兼有的门诊患者样本中提供了特别有影响力的示范,表明人特定症状网络与群体汇总模式存在显著差异。Fisher等人(2018)将这一点形式化为泛化性批判,认为群体到个体的不可转移性是人体研究中的结构性威胁,无法仅通过更大样本解决。后续工作建立了基于个体化动态模型的个性化治疗靶向算法(Fernandez等,2017;Fisher等,2019),推动了更广泛的以人为中心的临床方法论转变。

### 1.2 DTVEM框架及其群体水平局限性

该研究计划中的一个核心问题涉及症状动态的时间架构:一个症状或情绪以怎样的时间间隔预测另一个?Jacobson等人(2019)引入的差分时变效应模型(DTVEM)通过一种优雅的两阶段混合程序解决了这一问题。

在第1阶段,探索性广义可加混合模型(GAMM)对滞后距离 \\(\\Delta t\\) 上的自回归系数进行平滑,产生连续的滞后效应曲线 \\(\\hat{f}(\\Delta t)\\)。该曲线的波峰和波谷(其95%置信带排除零)识别出依赖关系统计上可靠的候选滞后。在第2阶段,仅使用这些候选滞后作为预测变量指定向量自回归(VAR)模型,然后作为状态空间模型在OpenMx中进行估计。结果是一个仅包含阶段1识别出的数据支持滞后的验证性模型。

DTVEM在精神病理学、睡眠、人格和数字生物标志物研究中被广泛采用。其吸引力在于结合了非参数灵活性(阶段1对滞后形状假设很少)与简洁的验证性估计(阶段2仅拟合数据支持的结构)。

然而,已发表的DTVEM假设滞后结构 \\(\\hat{f}(\\Delta t)\\) 在数据集中的所有个体间共享。探索性平滑器拟合至汇总数据,验证性VAR估计一组统一应用的系数。原作者在其结语中明确承认了这一局限性:

> "目前的模拟研究未考虑动力学或滞后结构的人特定差异。鉴于此,DTVEM模型的未来扩展可能能够在GAMM框架内包含随机效应,以建模人特定差异"(Jacobson等,2019,第311页)。

这一局限性不仅仅是技术性问题。个体化临床研究的前提是个体在动力学上存在差异。将一种假设共享滞后结构的方法应用于本质上是关于异质性的研究问题,这在内部是不一致的:它丢弃了研究本身旨在研究的变异。这一方法论空白正是原作者列为未来工作优先方向的那个。

### 1.3 当前工作

我们提出DTVEM-RE(带随机效应的DTVEM),一种估计具备向群体均值收缩的人特定滞后曲线的分层扩展。探索阶段使用因子平滑GAMM恢复带有自动每人正则化的个体滞后曲线。验证阶段将这些滞后嵌入通过Stan中哈密顿蒙特卡洛估计的分层贝叶斯状态空间VAR中。

贡献有三方面。首先,我们指定了DTVEM-RE模型并提供了Stan实现,附有用于复现的完整代码。其次,我们通过受控模拟研究验证了参数恢复,表明群体间方差参数 \\(\\tau\_a\\) 在EMA研究的典型样本量下无显著偏差恢复,且可信区间覆盖率接近名义水平。第三,我们将DTVEM-RE应用于Fisher等人(2017)的生态瞬时评估数据集,并展示了:(a) 三个情感项目在滞后1自回归效应上存在显著的人间异质性;(b) 在留出评估中,预测性能相比其他方法有适度但一致的改进;(c) 在多滞后扩展中,滞后1、2和3同时存在统计上稳健的人间异质性,且异质性最大的滞后在不同项目间存在差异。最后这一发现超出了现有仅对滞后1系数放置随机效应的分层VAR方法的建模范围。

论文结构如下:第2节回顾相关方法并将DTVEM-RE置于现有格局中。第3节指定数据、模型、先验、估计程序以及模拟和留出预测协议。第4节分四部分报告结果:模拟中的参数恢复、Fisher数据上的阶段1 GAMM探索、阶段2滞后1拟合(含跨方法验证和留出预测),以及多滞后扩展。第5节讨论含义、局限性和未来工作方向。

## 2 相关方法

DTVEM-RE位于两种方法学文献的交汇处:针对密集纵向数据的分层VAR扩展,以及超越固定滞后1规范的滞后探索方法。我们简要回顾每一种。

### 2.1 分层滞后1方法

个体化精神病理学研究中VAR模型的主要分层扩展是多水平VAR(mlVAR)(Bringmann等,2013;Epskamp等,2018)。该框架起源于Bringmann等人(2013),引入了一种具有随机效应(针对滞后1自回归和交叉滞后系数)的ESM数据多水平VAR,并由Epskamp等人(2018)扩展,结合了时序和同期网络估计。mlVAR被广泛使用,并为网络精神病理学文献中的许多实质性发现提供了依据。然而,在其实现中,mlVAR仅对滞后1系数估计随机效应;它并不旨在发现人与人之间的异质性在不同滞后距离上是否在幅度上存在差异。

群体迭代多元模型估计(GIMME)及其潜在变量扩展LV-GIMME(Gates等,2020)采用不同的异质性处理方法,进行数据驱动的个体特定结构路径搜索。可以包含滞后路径,并且GIMME原则上升不限制自己只考虑滞后1路径。然而,GIMME是一种模型搜索方法而非分层聚合方法;它不对人特定滞后系数放置群体分布,也不提供分层模型在中等每人样本量下所具有的收缩性。

Multi-VAR(Fisher等,2022)使用自适应LASSO惩罚同时估计多个受试者的VAR模型,允许跨人的共享和特异转移矩阵元素。该框架支持多滞后,但它不对人特定滞后系数放置具有明确收缩性的分层群体分布。处理异质性的机制是惩罚估计而非部分聚合。

### 2.2 多滞后探索方法

DTVEM(Jacobson等,2019)是密集纵向数据中非参数滞后探索的主要方法。其基于GAMM的阶段1不对滞后效应核的形状做参数假设,允许检测包括延迟效应、次级峰值和振荡模式在内的复杂结构。然而,DTVEM仅在群体水平上运行。

连续时间替代方案,包括分层ctsem(Driver & Voelkle,2018),对潜在过程进行连续时间建模并自然处理不规则间隔。这些方法通过构造施加指数衰减形状,牺牲了DTVEM的非参数灵活性以换取对不等时间间隔的原则性处理。分层ctsem支持所有模型参数上的随机效应,包括控制时间依赖性的漂移矩阵,但滞后效应形状由连续时间公式固定而非非参数估计。

### 2.3 DTVEM-RE填补的空白

据我们所知,没有任何已发表的方法将非参数多滞后探索与在每个检测到的滞后上对人特定滞后系数进行分层聚合相结合。最接近的现有方法各自覆盖了这一组合的一半:

- • 标准DTVEM:多滞后探索,仅群体水平。
- • mlVAR:分层聚合,但仅限滞后1随机效应。
- • LV-GIMME和multi-VAR:支持多滞后和人特定结构,但通过模型搜索或惩罚估计而非分层聚合处理异质性。
- • 分层ctsem:分层且连续时间,但连续时间公式强制施加指数衰减。

## 3 方法

本节统一数据、模型规范、估计程序和模拟设计。呈现顺序为先实质性材料(我们分析了什么),然后是服务于它的方法论材料。DTVEM-RE的阶段1是分层GAMM;阶段2是分层贝叶斯状态空间VAR。当阶段2中的人间方差分量被约束为零时,DTVEM-RE退化为标准DTVEM。

### 3.1 数据

我们使用公开可用的Fisher等人(2017)生态瞬时评估(EMA)数据集,托管在开放科学框架上,网址为 https://osf.io/zefbc/。样本包含40名符合DSM标准、患有广泛性焦虑障碍(GAD)、重度抑郁障碍(MDD)或两者兼有的门诊患者。每位参与者在约三十天内,每天在清醒时间以伪随机间隔接受四次智能手机传送的EMA提示。每次提示收集0到100的视觉模拟评分,涵盖28个情感和焦虑项目。

在剔除错过提示后,分析数据集包含40名参与者共4,463次完成提示,每人中位提示数为113次(范围90至151次)。两名参与者在协议内依从中断超过72小时;我们将这些数据分割成单独会话,并在整个分析中仅使用每位参与者的第一次会话,以便在样本中保持可比较的分析窗口。连续两次完成提示之间的中位间隔约为4.3小时(白天),夜间间隔10至12小时。

我们聚焦于三个选择以涵盖情感领域的项目:**down**(负性情感,低唤醒;代表抑郁核心簇)、**worried**(负性情感,高唤醒;代表焦虑核心簇)和**energetic**(正性激活)。用三个项目而不是一个来演示方法,可以证明结果并非项目特定。我们在分析的每个阶段都完整报告所有三个项目。我们没有事先筛选项目以确定它们是否具有所研究的属性(滞后系数的人间异质性);这三个项目是在估计之前基于实质性理由选定的。

![图1](自述) 图1:四名代表性参与者(P001、P040、P145、P202)在整个研究周期内的EMA项目轨迹。显示的四个项目中的三个(down、worried、energetic)在本文中进行了分析;angry 用于额外说明该数据集中动态的定性范围。横轴显示从研究开始的小时数。

相似文章

图数据中差异化网络效应的处理效应估计

arXiv cs.LG

本文通过建模差异化网络效应解决了从图数据中估计个体处理效应的挑战,提出了一种包含部分注意力和信息放大器的机制,以捕捉邻居的不同重要性和规模。实验表明,该方法性能优于现有方法。

基于时空并行解码与置信度外推的高效扩散LLMs

arXiv cs.CL

本文介绍了时空并行解码(TSPD)和置信度外推(CE),通过动态判断令牌何时收敛并预测logit趋势,来加速基于扩散的大语言模型的推理,减少不必要的去噪步骤,同时保持输出质量。

用于离策略时序差分预测的行为感知辅助修正

arXiv cs.AI

本文提出用于离策略时序差分预测的行为感知辅助修正,引入了BA-TDC和BA-TDRC算法,这些算法用行为贝尔曼矩阵替代辅助协方差矩阵,以提高稳定性和收敛性。理论分析和在标准基准上的实验验证了所提方法的有效性。