基于H2O平台自动化机器学习的糖尿病视网膜病变预测模型的建立
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1006-1959.2023.22.002

基于H2O平台自动化机器学习的糖尿病视网膜病变预测模型的建立

引用
目的 利用H2O平台推出的自动化机器学习(AutoML)算法,建立预测糖尿病(DM)视网膜病变(DR)模型.方法 纳入2019年1月-2021年1月于本院就诊的606例DM患者,根据眼底照相分为单纯DM组(DM组,303例)及DM合并DR组(DR组,303例).采集两组患者基本情况、血生化检测结果及视网膜图像等数据.利用H2O AutoML算法建立针对DR二分类结局,进行变量筛选并建立机器学习预测模型,产生相应预测结果,据此绘制ROC曲线并建立混淆矩阵,绘制SHAP及部分依赖图,评价模型区分能力.结果 DR组糖尿病病程长于DM组,吸烟、饮酒、高血压、脂肪肝比例、腰臀比、BMI及收缩压高于DM组,差异有统计学意义(P<0.05);DR组HDL-C低于DM组,FPG、FINS、HOMA-IR、HbA1c、ALT和AST均高于DM组,差异有统计学意义(P<0.05).将两组特征数据载入AutoML工作环境中,得到最佳模型为通用梯度回归模型(GBM),该模型Gini值0.914,R2为0.679,LogLoss为0.260.重要性排名前3的变量包括FPG、糖尿病病程及FINS.在Train数据集中,ROC曲线下面积为0.942(95%CI:0.921~0.963).利用混淆矩阵得到特异度为0.924,敏感度为0.959,准确度为0.942,误分类率为0.058.在Valid数据集中,ROC曲线下面积为0.831(95%CI:0.764~0.897).利用混淆矩阵得到特异度为0.828,敏感度为0.833,准确度为0.831,误分类率为0.169.结论 本次利用AutoML算法建立的通用梯度回归DR患病预测模型可用于DM人群中DR的筛查.

糖尿病视网膜病变、自动化机器学习、预测模型、混淆矩阵、SHAP可视化、部分依赖图

36

R587.2;R774.1(内分泌腺疾病及代谢病)

苏州市医疗卫生科技创新应用基础研究;苏州市姑苏卫生人才计划项目

2023-12-08(万方平台首次上网日期,不代表论文的发表时间)

共6页

8-13

相关文献
评论
暂无封面信息
查看本期封面目录

医学信息

1006-1959

61-1278/R

36

2023,36(22)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn