面向临床数据的离散化贝叶斯网络分类器的并行自适应多目标进化学习
摘要
本文针对Baymex算法引入了并行化策略和自适应引导机制,以高效学习用于临床数据的离散化贝叶斯网络分类器,在16核CPU上实现了超过54倍的加速,并在保持可解释性的同时,获得了与传统模型相当或更优的预测性能。
arXiv:2605.29058v1 公告类型:新
摘要:贝叶斯网络(BN)从可解释人工智能的角度来看具有重要意义,它提供透明的概率模型以支持决策。Baymex是最近提出的一种用于学习离散化BN的多目标进化算法,使专家能够权衡不同的感兴趣目标,例如似然、模型复杂度和先验信念。尽管Baymex已被证明优于最先进的BN学习方法,但它仍然存在两个问题:1) 需要大量计算时间;2) 仅在合成数据上进行了评估。为了提高可扩展性,我们引入了并行化策略以及一种能够自适应地将优化导向过拟合较少网络的机制。此外,我们重新配置了Baymex,通过交叉熵损失和BIC复杂度项的多目标优化来训练BN分类器,以评估其在真实临床分类任务上的性能。除了在16核CPU上观察到超过54倍的加速外,与临床上熟悉的基线模型(决策树、逻辑回归、朴素贝叶斯和随机森林)在两个开源数据集(RADCURE和SUPPORT)以及一个内部数据集上的比较表明,Baymex在生成紧凑、可临床检查的BN的同时,获得了统计上相似或更好的预测性能。重要的是,Baymex能够找到多个合理的BN分类器,其中包含与既定临床因素一致的预测因子。
查看缓存全文
缓存时间: 2026/05/29 09:15
# 面向临床数据的离散化贝叶斯网络分类器的并行自适应多目标进化学习 Source: https://arxiv.org/html/2605.29058 Damy M.F. Ha,Thalea [email protected] (https://arxiv.org/html/2605.29058v1/mailto:[email protected])莱顿大学医学中心,荷兰莱顿,Yvette M. van der LindenY.M.van ̇der ̇[email protected] (https://arxiv.org/html/2605.29058v1/mailto:Y.M.van%CB%99der%CB%[email protected])莱顿大学医学中心,荷兰莱顿,Peter A.N. [email protected] (https://arxiv.org/html/2605.29058v1/mailto:[email protected])荷兰国家数学与计算机科学研究中心,荷兰阿姆斯特丹,andTanja [email protected] (https://arxiv.org/html/2605.29058v1/mailto:[email protected])莱顿大学医学中心,荷兰莱顿 (2009年6月5日) ###### 摘要. 贝叶斯网络(BNs)从可解释人工智能的角度出发,提供透明的概率模型以支持决策。Baymex 是一种近期提出的、用于学习离散化 BN 的多目标进化算法,使专家能够权衡不同的感兴趣目标,例如似然性、模型复杂度和先验信念。虽然 Baymex 已被证明优于最先进的 BN 学习方法,但它仍然存在两个问题:1)需要大量的计算时间;2)仅在合成数据上进行了评估。为了提升可扩展性,我们引入了一种并行化策略,以及一种能够自适应地将优化导向过拟合更少网络的机制。此外,我们重新配置了 Baymex,通过交叉熵损失和 BIC 复杂度项的多目标优化来训练 BN 分类器,从而评估其在真实世界临床分类任务上的性能。除了在 16 核 CPU 上观察到高达 54 倍以上的加速外,与临床熟悉的基线方法(决策树、逻辑回归、朴素贝叶斯和随机森林)在两个开源数据集(RADCURE 和 SUPPORT)以及一个内部数据集上的比较表明,Baymex 在获得统计上相似或更好的预测性能的同时,生成了紧凑且可临床检查的 BN。重要的是,Baymex 能够找到多个合理的 BN 分类器,其中包含与已确定临床因素一致的预测因子。 贝叶斯网络,进化算法,多目标优化,并行化,自适应引导,可解释人工智能 ††journalyear:2026††copyright:cc††ccs:计算方法 并行计算方法††ccs:计算方法 贝叶斯网络模型††ccs:计算方法 随机化搜索††ccs:计算方法 机器学习## 1. 引言 每天,临床医生都会整合症状、合并症、影像学和实验室结果,形成关于诊断、治疗反应和生存的概率判断,以指导患者治疗。提供准确的数据驱动决策支持工具有助于提高这些决策的一致性、透明度和整体质量。尽管现代人工智能方法在广泛的临床任务中展现出巨大潜力,但它们在实践中的采用仍然有限,部分原因是大多数模型不够透明(Kyrimi et al., 2021 (https://arxiv.org/html/2605.29058#bib.bib28))。 贝叶斯网络(BNs)提供了一种源于经典人工智能的、值得信赖且经过验证的替代方案。BNs 使用有向无环图(DAG)和条件概率表提供变量的联合分布,允许显式建模条件结构,并实现透明的概率推理(Pearl, 1988 (https://arxiv.org/html/2605.29058#bib.bib25); Koller and Friedman, 2009 (https://arxiv.org/html/2605.29058#bib.bib26))。与许多黑箱预测器不同,学习到的结构(DAG)和条件概率表都可以被领域专家检查和质疑。这使得 BNs 从可解释人工智能(XAI)的角度来看特别有趣(Bernasconi et al., 2024 (https://arxiv.org/html/2605.29058#bib.bib30); Alves et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib33); Kyrimi et al., 2021 (https://arxiv.org/html/2605.29058#bib.bib28))。 尽管有这些优势,但从数据中学习 BN 的结构(即 DAG)在计算上仍然具有挑战性(Chickering, 1996 (https://arxiv.org/html/2605.29058#bib.bib27); Kitson et al., 2023 (https://arxiv.org/html/2605.29058#bib.bib29))。随着数据收集在样本数量和特征数量上的增长,执行(最优)结构学习变得越来越困难。此外,在许多临床应用中,数据包含实值特征,通常需要对这些特征进行离散化以构建 BN(例如,Osong et al., 2024 (https://arxiv.org/html/2605.29058#bib.bib35); Zhong et al., 2024 (https://arxiv.org/html/2605.29058#bib.bib36); Mateus et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib37))。然而,离散化过程(包括所使用的区间数量)会影响结构学习算法恢复的 BN 结构。不同的分箱选择会以不同的方式修改条件概率表,从而影响哪些依赖关系被选中。 最近引入的Baymex(基于进化智能的多目标可解释人工智能贝叶斯网络学习)算法(Ha et al., 2026 (https://arxiv.org/html/2605.29058#bib.bib5))通过结合最先进的多目标进化算法(EAs)(Luong et al., 2018 (https://arxiv.org/html/2605.29058#bib.bib6); Bouter et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib7), 2017 (https://arxiv.org/html/2605.29058#bib.bib8))来学习离散化 BN,从而解决了这一挑战的一部分。这导致搜索能够最好地权衡感兴趣目标(如似然性、模型复杂度和与专家信念的一致性)的解。因此,Baymex 不是提供一个单一的“最佳”网络,而是生成帕累托集的一个近似,其中包含多个在感兴趣目标之间进行权衡的合理 BN。除了能够从优化的权衡中获得额外见解外,实践者还可以选择最合适的模型(Ha et al., 2026 (https://arxiv.org/html/2605.29058#bib.bib5))。与需要接受绝大多数 BN 学习方法返回的单一模型相比(Alves et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib33); Maekawa et al., 2024 (https://arxiv.org/html/2605.29058#bib.bib34); Yu et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib32); Secchettin et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib31)),这提供了更大的灵活性和应用于实际的机会。尽管 Baymex 已被证明优于最先进的 BN 学习方法,但它仍然存在两个问题:1)需要大量的计算时间;2)仅在合成数据上进行了评估。在这项工作中,我们解决了这两个局限性。 首先,进化算法天然适合并行化,因为它们通常每代独立评估许多候选解。因此,并行进化计算得到了大量且已有充分文献支持(Cantú-Paz and Goldberg, 2000 (https://arxiv.org/html/2605.29058#bib.bib41); Huang et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib42); Guijt et al., 2023 (https://arxiv.org/html/2605.29058#bib.bib43))。在这项工作中,我们对 Baymex 进行并行化,并研究一种能够自适应地将优化重点仅放在不过拟合的网络上的机制。 其次,我们重新配置了 Baymex,通过交叉熵损失和 BIC 复杂度项(Schwarz, 1978 (https://arxiv.org/html/2605.29058#bib.bib18))的多目标优化来训练 BN 分类器。通过这样做,我们能够处理真实的分类任务,找到在预测性能和模型复杂度之间进行权衡优化的 BN 分类器。 我们评估了加速且从根本上改进的 Baymex 算法111Baymex 代码可在以下网址获取:https://github.com/damyha/baymex。在真实世界的临床分类任务上。为此,我们包含了 SUPPORT 数据集,这是一个大型队列,最初设计用于对重病住院成人患者的 180 天生存率进行预后建模(Connors et al., 1995 (https://arxiv.org/html/2605.29058#bib.bib12); Knottenbelt et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib13))。我们还包含了 RADCURE 数据集,这是一个开放获取的头颈部放疗队列,我们为其学习一个分类器来预测患者是否达到 2 年生存率(Welch et al., 2024 (https://arxiv.org/html/2605.29058#bib.bib14))。最后,我们回顾了由我们放疗科领导的一项关于晚期癌症患者脊柱骨转移生存率的研究,并使用 Baymex 通过分类预测至少 3 个月的生存率(Bollen et al., 2014 (https://arxiv.org/html/2605.29058#bib.bib9))。我们还与广泛使用、临床熟悉的基线方法进行了比较:逻辑回归、决策树、朴素贝叶斯和随机森林。 除了在 16 核 CPU 上观察到高达 54 倍以上的加速外,跨数据集我们发现,与可解释的基线方法相比,Baymex 获得了统计上相似或更好的预测性能,并且在某些情况下优于所有基线方法,同时生成了透明可检查的 DAG 和条件概率表。重要的是,Baymex 找到了多个合理的 BN 分类器,其中包含与已确定临床因素一致的预测因子。 ## 2. 背景 ### 2.1. 贝叶斯网络 贝叶斯网络(BN)是一种概率图模型,表示一组随机变量上的分解联合分布(Pearl, 1988 (https://arxiv.org/html/2605.29058#bib.bib25))。BN 由一个有向无环图(DAG)定义,其顶点表示随机变量,其有向边(即弧)指定了用于将联合分布分解为局部条件概率分布的父-子关系。具体来说,令X=\(X1,...,XN\)\mathbf{X}=\(X_{1},\dots,X_{N}\)表示NN个随机变量,令G=\(V,E\)G=\(V,E\)为一个 DAG,其顶点VV对应于随机变量,边EE连接顶点。BN 将联合概率分布分解如下:p\(X\)=∏i=1Np\(Xi∣pa\(Xi\)\)p\(\mathbf{X}\)=\prod_{i=1}^{N}p\!\left\(X_{i}\mid\mathrm{pa}\(X_{i}\)\right\), 其中pa\(Xi\)\mathrm{pa}\(X_{i}\)表示 DAG 中第ii个顶点对应的所有父顶点变量。 ### 2.2. Baymex:学习离散化 BN 为了理解本文对 Baymex 提出的改进,我们将在此列出 Baymex 的核心概念,但详细信息请感兴趣的读者参考相关文献(Ha et al., 2026 (https://arxiv.org/html/2605.29058#bib.bib5))。 #### 2.2.1. 混合离散/实值决策空间 Baymex 的一个核心特性是能够在混合离散和实值搜索空间中进行多目标优化。Baymex 使用离散编码方案对 BN 的 DAG 结构进行建模。对于一个具有NN个顶点的网络,潜在边的空间由ltotal=N\(N−1\)2\ell_{\text{total}}=\frac{N(N-1)}{2}个变量定义。顶点ii和jj(j\>ij\>i且i,j≤Ni,j\leq N)之间的每条潜在边被建模为一个三元决策变量∈\{0,1,2\}\in\left\{0,1,2\right\}, 分别代表无连接、有向边i→ji\rightarrow j或有向边j→ij\rightarrow i。为了确保每个解都编码一个无环图,Baymex 实现了一种修复机制,能够识别并修复循环依赖。 #### 2.2.2. 离散化。 为了处理实值数据,Baymex 在搜索过程中使用编码到解中的区间对实值数据进行离散化。具体来说,对于每个实值特征jj,区间计数BjB_{j},即用于离散化实值数据的区间数量,被编码为介于最小值 2 和用户定义的最大值BjmaxB_{j}^{\text{max}}之间的离散决策变量。在 Baymex 中,区间边界定义为连续样本之间的中点。为此,对样本进行排序并删除重复值。排序列表中的一个索引则描述了在连续的样本之间定义区间边界的位置。由于索引通常很多,这里使用一个实值决策变量,在评估时将其四舍五入到最近的整数。因为根据要使用的区间边界数量,最佳区间边界可能位于非常不同的位置,在 Baymex 中,对于所有n∈\{2,3,...,Bjmax\}n\in\{2,3,\ldots,B_{j}^{\text{max}}\},使用了n−1n-1个不同的索引用于nn个区间: \[b21j⏟2 bins,b31j,b32j⏟3 bins,b41j,b42j,b43j⏟4 bins,⋯\]\left[\begin{array}[]{c}\!\underbrace{b_{21}^{j}}_{\text{2 bins}},\underbrace{b_{31}^{j},b_{32}^{j}}_{\text{3 bins}},\underbrace{b_{41}^{j},b_{42}^{j},b_{43}^{j}}_{\text{4 bins}},\cdots\!\end{array}\right]这里,bkijb_{ki}^{j}是用于将变量jj分隔成kk个区间的第ii个边界。BjB_{j}的值决定了表示中哪些区间边界是激活的。其他区间边界保留在解中,但被去激活,即它们是内含子。 #### 2.2.3. 基于基因库最优混合的变异 Baymex 结合了来自不同基因库最优混合进化算法(GOMEA)变体的核心组件,并根据 BN 学习的需求进行了调整。针对多目标优化的特定目标,Baymex 借鉴了多目标 GOMEA 的一个关键组件(Luong et al., 2018 (https://arxiv.org/html/2605.29058#bib.bib6)):聚类。每一代,种群在目标空间中被聚类成k个大致相等的组,每组处理近似前沿的一部分。对于每个聚类,Baymex 分别配置变异模型,以使变异适应每个区域的局部结构。Baymex 使用了三种变异算子:GOM(Luong et al., 2018 (https://arxiv.org/html/2605.29058#bib.bib6))、GI-GOM(Bouter et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib7))和 RV-GOM(Bouter et al., 2017 (https://arxiv.org/html/2605.29058#bib.bib8)),分别针对 BN 结构、区间数量和区间边界。每种算子通过为解中所有变量的一个子集采样新值,并仅在此变化未使解变差或该解可被添加到精英存档时才接受该变化,从而将变异与选择相结合。否则,变化将被撤销。这种子集称为链接集。链接集和采样过程的配置方式因变量类型而异,具体细节请参考文献(Ha et al., 2026 (https://arxiv.org/html/2605.29058#bib.bib5); Luong et al., 2018 (https://arxiv.org/html/2605.29058#bib.bib6); Bouter et al., 2025 (https://arxiv.org/html/2605.29058#bib.bib7), 2017 (https://arxiv.org/html/2605.29058#bib.bib8))。 #### 2.2.4. 精英存档 为了保留搜索过程中找到的非支配解,Baymex 维护一个精英存档。尽管实现支持容量约束(参见 Luong and Bosman, 2012 (https://arxiv.org/html/2605.29058#bib.bib2)),但在我们的实验中,非支配解的数量相对于目标存档大小(10,000 个解)相对较小。因此,该存档作为一个常规的精英存档运作。 #### 2.2.5. 算法结构 算法
相似文章
面向理解高维贝叶斯优化的自动化核发现
论文介绍了Kernel Discovery,这是一个LLM驱动的进化框架,用于高维贝叶斯优化,它搜索更广泛的核空间并在基准测试上取得了最先进的结果。
ClinicalMC:面向大语言模型的多疗程临床决策基准
ClinicalMC是一个基准,旨在评估大语言模型在多疗程临床决策中的表现,包含中文和英文数据集以及一个多智能体评估框架。
MedExAgent:在嘈杂的临床环境中训练大语言模型代理进行询问、检查与诊断
本文介绍了 MedExAgent,这是一个将临床诊断形式化为部分可观测马尔可夫决策过程(POMDP)以处理嘈杂和不完整信息的框架。该框架提出了一种结合监督微调与强化学习的两阶段训练流程,以提高医疗大语言模型的诊断准确性和成本效益。
贝叶斯模型合并
介绍贝叶斯模型合并(BMM),这是一个即插即用的双层优化框架,用于将多个任务特定的专家模型合并为一个单一模型,在视觉和语言基准测试上实现了最先进的性能。
MEDSYN: 复杂临床病例中多证据综合的多模态大语言模型基准测试
MEDSYN 是一个多语言多模态基准,用于评估多模态大语言模型(MLLMs)在复杂临床病例上的表现,每个病例最多包含 7 种不同的视觉证据类型。研究表明,虽然前沿模型在鉴别诊断生成方面与人类专家相当,但所有 MLLMs 在最终诊断选择中均存在显著差距,原因是异质临床证据综合能力不足。