基于可解释集成机器学习模型检测丙型肝炎患者肝硬化的存在
摘要
本文应用集成机器学习模型(随机森林、梯度提升、XGBoost、极端随机树)检测丙型肝炎患者的肝硬化,使用了来自2038名埃及患者的28个特征。极端随机树模型仅用16个特征就达到了96.92%的准确率,优于其他模型。
arXiv:2606.26561v1 公告类型:新
摘要:丙型肝炎是一种由病毒引起的肝脏感染,会导致轻度至重度的肝脏炎症。多年以来,丙型肝炎逐渐损害肝脏,常导致永久性疤痕,即肝硬化。患者有时在发展为肝硬化之前几十年内只有中度或无症状的肝脏疾病。肝硬化通常会恶化至肝衰竭。肝硬化患者还可能出现脑和神经系统损伤以及胃肠道出血。肝硬化的治疗重点是防止疾病进一步进展。因此,早期检测肝硬化对于避免并发症至关重要。机器学习(ML)已被证明能够提供精确和准确的信息用于诊断多种疾病。尽管如此,至今尚无研究使用ML检测丙型肝炎患者的肝硬化。本研究从加州大学欧文分校的机器学习仓库获取了一个数据集,包含2038名埃及患者的28个属性。在数据集上训练了四种ML算法以诊断丙型肝炎患者的肝硬化:随机森林、梯度提升机、极端梯度提升和极端随机树模型。极端随机树模型表现优于其他模型,仅使用28个特征中的16个便达到了96.92%的准确率、94.00%的召回率、99.81%的精确率以及96%的受试者工作特征曲线下面积。
查看缓存全文
缓存时间: 2026/06/26 05:13
# 可解释的集成机器学习模型用于检测丙型肝炎患者的肝硬化存在 来源:https://arxiv.org/abs/2606.26561 查看PDF (https://arxiv.org/pdf/2606.26561) > 摘要:丙型肝炎是一种由病毒引起的肝脏感染,会导致肝脏轻度至重度炎症。多年来,丙型肝炎逐渐损害肝脏,常导致永久性瘢痕,即肝硬化。患者在发展为肝硬化之前的数十年内,有时仅出现中度甚至无肝脏疾病症状。肝硬化通常会恶化至肝功能衰竭。肝硬化患者还可能经历脑部和神经系统损伤,以及胃肠道出血。肝硬化的治疗重点在于预防疾病的进一步恶化。因此,早期检测肝硬化对于避免并发症至关重要。机器学习已被证明能为多种疾病的诊断提供精准的信息。尽管如此,迄今为止尚无研究使用机器学习检测丙型肝炎患者的肝硬化。本研究从加州大学欧文分校的机器学习库中获取了一个包含2038名埃及患者28个属性的数据集。在数据集上训练了四种机器学习算法以诊断丙型肝炎患者的肝硬化:随机森林、梯度提升机、极端梯度提升和极限随机树模型。其中,极限随机树模型表现最佳,仅使用28个特征中的16个特征即达到96.92%的准确率、94.00%的召回率、99.81%的精确率和96%的受试者工作特征曲线下面积。 ## 提交历史 来自:Abrar Alotaibi [查看电子邮件](https://arxiv.org/show-email/9eb85a9f/2606.26561) **[v1]** 2026年6月25日星期四 03:13:37 UTC (3,313 KB)
相似文章
基于梯度提升与无分布覆盖的非酒精性脂肪肝病一致性风险预测
本文介绍了LiverRisk,一个用于NAFLD风险预测的机器学习框架,它结合了梯度提升决策树和一致性预测,为个体风险评估提供校准后的无分布覆盖保证,在内部和外部队列上均实现了高AUROC。
基于可解释机器学习与临床生物标志物的阿尔茨海默病早期检测:利用阿尔茨海默病神经影像学倡议(ADNI)数据集的多分类研究
本研究利用ADNI数据集中的八项临床生物标志物,构建了一个结合SHAP可解释性的XGBoost分类器,实现对阿尔茨海默病的三分类检测(认知正常、轻度认知障碍、AD),在留出测试集上达到宏观AUC 0.982、Cohen's kappa 0.909。SHAP分析表明,CDR整体评分是认知正常和轻度认知障碍的主导预测因子,而CDR-SB与MMSE共同驱动了AD的分类判别。
利用生理信号通过机器学习预测考试结果
本研究探讨了利用皮肤电活动、心率和皮肤温度等生理数据,通过机器学习模型预测考试结果,发现深度学习方法与随机森林等简单模型均能有效发挥作用。
用于乳腺癌复发预测的多模态机器学习
本文探讨了整合多模态临床数据(包括治疗记录、病理报告和临床医生笔记)的方法,通过基于规则的提取和机器学习,与单模态方法相比,提高乳腺癌复发预测的准确性。
基于CT钙化积分扫描中机会性冠状动脉钙化和心外膜脂肪评估的机器学习预测阻塞性冠状动脉疾病
本文提出了一种使用CatBoost和SHAP的机器学习框架,通过结合钙组学和心外膜脂肪特征,从CT钙化积分扫描中预测阻塞性冠状动脉疾病,实现了高准确性。