10.19485/j.cnki.issn2096-5087.2021.07.018
应用随机森林模型和Logistic回归模型分析COVID-19的影响因素
目的 应用随机森林模型和Logistic回归模型分析新型冠状病毒肺炎(COVID-19)发病的影响因素,为COVID-19防治提供依据.方法 选择2020年1月17日—2月17日浙江省6家医院收治的COVID-19疑似病例为研究对象,通过问卷收集人口学资料、既往基础疾病、流行病学史、临床表现、实验室检测指标和肺部影像学表现等,分别建立随机森林模型和Logistic回归模型分析COVID-19发病的影响因素.结果 共纳入786例COVID-19疑似病例,其中确诊病例336例,占42.75%.随机森林模型分析结果显示,COVID-19发病的影响因素重要性排名前十位依次是白细胞计数正常或减少、胸部影像学表现、淋巴细胞计数减少、聚集性发病、发病前14天内接触来自疫区的发热或呼吸道症状患者、乏力、发病前14天内有疫区旅居史、呼吸困难、鼻塞流涕和肌肉酸痛.多因素Logistic回归模型分析结果显示,发病前14天内有疫区旅居史(OR=8.440,95%CI:4.204~16.944)、发病前14天内接触来自疫区的发热或呼吸道症状患者(OR=2.967,95%CI:1.630~5.402)、聚集性发病(OR=25.164,95%CI:11.833~53.516)、乏力(OR=2.710,95%CI:1.490~4.930)、呼吸困难(OR=5.276,95%CI:2.076~13.410)、肌肉酸痛(OR=14.187,95%CI:1.998~100.730)、白细胞计数正常或减少(OR=1.750,95%CI:1.659~1.852)和胸部影像学表现(OR=6.291,95%CI:4.315~9.171)均与COVID-19存在统计学关联.结论 两种模型的分析结果相似,随机森林模型显示各个因素在COVID-19发病中的重要程度,Logistic回归模型可直观解释不同因素的风险度.
新型冠状病毒肺炎;Logistic回归模型;随机森林模型;影响因素
33
R195(保健组织与事业(卫生事业管理))
浙江省重点研发计划应急攻关项目子课题2020C03123
2021-09-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
722-725