10.3969/j.issn.1006-1959.2023.22.002
基于H2O平台自动化机器学习的糖尿病视网膜病变预测模型的建立
目的 利用H2O平台推出的自动化机器学习(AutoML)算法,建立预测糖尿病(DM)视网膜病变(DR)模型.方法 纳入2019年1月-2021年1月于本院就诊的606例DM患者,根据眼底照相分为单纯DM组(DM组,303例)及DM合并DR组(DR组,303例).采集两组患者基本情况、血生化检测结果及视网膜图像等数据.利用H2O AutoML算法建立针对DR二分类结局,进行变量筛选并建立机器学习预测模型,产生相应预测结果,据此绘制ROC曲线并建立混淆矩阵,绘制SHAP及部分依赖图,评价模型区分能力.结果 DR组糖尿病病程长于DM组,吸烟、饮酒、高血压、脂肪肝比例、腰臀比、BMI及收缩压高于DM组,差异有统计学意义(P<0.05);DR组HDL-C低于DM组,FPG、FINS、HOMA-IR、HbA1c、ALT和AST均高于DM组,差异有统计学意义(P<0.05).将两组特征数据载入AutoML工作环境中,得到最佳模型为通用梯度回归模型(GBM),该模型Gini值0.914,R2为0.679,LogLoss为0.260.重要性排名前3的变量包括FPG、糖尿病病程及FINS.在Train数据集中,ROC曲线下面积为0.942(95%CI:0.921~0.963).利用混淆矩阵得到特异度为0.924,敏感度为0.959,准确度为0.942,误分类率为0.058.在Valid数据集中,ROC曲线下面积为0.831(95%CI:0.764~0.897).利用混淆矩阵得到特异度为0.828,敏感度为0.833,准确度为0.831,误分类率为0.169.结论 本次利用AutoML算法建立的通用梯度回归DR患病预测模型可用于DM人群中DR的筛查.
糖尿病视网膜病变、自动化机器学习、预测模型、混淆矩阵、SHAP可视化、部分依赖图
36
R587.2;R774.1(内分泌腺疾病及代谢病)
苏州市医疗卫生科技创新应用基础研究;苏州市姑苏卫生人才计划项目
2023-12-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
8-13