10.7659/j.issn.1005-6947.2023.07.012
基于H2O自动化机器学习的肝硬化患者死亡预测模型的建立
背景与目的:晚期肝硬化患者往往出现一系列并发症,死亡风险增加.因此,尽早识别肝硬化死亡高风险具有重要的临床意义.本研究利用H2O平台自动化机器学习(AutoML)框架,建立预测肝硬化患者入院30 d死亡模型,以期为改善肝硬化患者预后以及肝硬化临床管理提供新的方法.方法:收集江苏大学附属金坛医院及湖南省人民医院肝硬化住院患者入院时一般资料及实验室检查数据.利用H2O AutoML框架建立针对死亡结局的多种机器学习算法模型,绘制受试者工作特征(ROC)曲线并建立混淆矩阵来评价模型效力,同时对重要变量进行可视化呈现.结果:最佳模型为梯度提升机(GBM),Gini值0.994,R2为0.775,LogLoss为0.120.模型中重要变量包括凝血酶原时间、肌酐、白细胞及年龄.变量SHAP特征图及部分依赖图呈现了重要变量与模型整体预测的相关性.局部可解析性算法(LIME)可视化显示变量在个体预测的作用.最佳模型GBM在验证集中特异度为0.950,敏感度0.676,ROC曲线下面积(AUC)为0.793,优于基于极致梯度提升(XG-Boost)、Logistic回归、随机森林和深度学习四个算法模型,以及终末期肝病模型(MELD)及白蛋白-胆红素(ALBI)评分.结论:所建立的预测短期死亡机器学习模型对肝硬化患者的短期死亡风险筛查提供了有效的工具,但其可靠性仍需多中心的外部验证进一步评估.
肝硬化、机器学习、模型、统计学、混淆矩阵、数据可视化
32
R657.3(外科学各论)
江苏省常州市科技局第十三批科技计划应用基础研究基金资助项目;江苏大学医教协同创新基金资助项目
2023-08-23(万方平台首次上网日期,不代表论文的发表时间)
共8页
1071-1078