机器学习基于不平衡数据预测急性新发缺血性卒中患者院内死亡模型研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1673-5765.2021.08.005

机器学习基于不平衡数据预测急性新发缺血性卒中患者院内死亡模型研究

引用
目的 探索利用机器学习基于不平衡数据预测急性新发缺血性卒中患者的院内死亡风险,并比较机器学习模型和传统logistic模型的预测性能.方法 以中国卒中联盟多中心登记数据库中急性新发缺血性卒中患者为研究对象,分别基于机器学习[XGBoost模型、CatBoost模型、随机森林模型、支持向量机(support vector machine,SVM)模型]和传统logistic方法构建患者院内死亡预测模型.按照7:3比例随机分为训练集和测试集,训练集用于构建预测模型,测试集用于评价模型效果.采用欠采样技术和平衡权重的方法处理死亡结局的不平衡数据.模型的评价指标包括区分度指标ROC中AUC和校准度指标Brier分数.结果 共纳入601466例急性新发缺血性卒中的患者,女性231235例(38.45%),院内死亡2206例(0.37%).logistic模型、XGBoost模型、CatBoost模型、随机森林模型、SVM模型预测患者院内死亡的AUC分别是0.913±0.000、0.921±0.000、0.919±0.001、0.925±0.000和0.900±0.001,其中XGBoost模型(P=0.0002)、CatBoost模型(P=0.0094)和随机森林模型(P<0.0001)的预测性能优于logistic模型,logistic模型表现优于SVM模型(P=0.0029).logistic模型、XGBoost模型、CatBoost模型、随机森林模型、SVM模型的Brier分数分别为0.115±0.001、0.096±0.001、0.093±0.001、0.084±0.000和0.045±0.001,机器学习模型的校准度均优于logistic模型,差异有统计学意义.结论 平衡数据处理后,机器学习模型和传统logistic模型预测急性新发缺血性卒中患者院内死亡风险表现均良好且稳定,其中,随机森林模型的预测性能最佳,SVM模型的校准度最佳.

缺血性卒中;院内死亡;预测模型;机器学习

16

"十三五"国家重点研发计划2016YFC0901001

2021-09-07(万方平台首次上网日期,不代表论文的发表时间)

共8页

779-786

相关文献
评论
暂无封面信息
查看本期封面目录

中国卒中杂志

1673-5765

11-5434/R

16

2021,16(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn