10.13421/j.cnki.hjwsxzz.2023.07.002
基于LASSO回归与随机森林算法的2型糖尿病发病风险因素分析
目的 基于 LASSO回归与随机森林算法分析 2 型糖尿病的发病风险因素,为临床决策提供参考.方法 以中国健康与养老追踪调查数据库 2011 年和 2015 年的数据进行队列研究,调查 45 岁及以上人群 2 型糖尿病的风险因素,共纳入3803 名研究对象.研究以人口学变量、生活习惯、血生化指标、2010-2015 年气象数据、空气质量监测数据为自变量,糖尿病结局为因变量,采用 LASSO回归与随机森林重要性排序进行特征变量选择,构建随机森林预测模型并进行效能评价.结果 经随机森林算法分析,空腹血糖、相对湿度、腰围、体质指数、黑碳、硝酸盐、风速、总胆固醇、温度和供暖燃料是 2 型糖尿病排名前 10 的重要危险因素.结合 LASSO 回归与随机森林变量重要性排序构建预测模型.经十折交叉验证,模型灵敏度为62.1%、特异度为 98.8%、准确度为 95.4%、阳性预测值为 89.6%、阴性预测值为 96.0%,AUC达 84.8%.决策曲线结果显示,模型在阈值 0~0.85 范围内具有较高的净收益率.结论 高龄、女性、肥胖情况、血检监测数据异常、高血压或卒中病史和环境污染物暴露可能指示 2 型糖尿病的发生发展,为临床医生对糖尿病高危人群的早期干预提供一定参考依据.
2型糖尿病、风险因素、随机森林、回顾性队列研究
13
R12(环境卫生、环境医学)
国家自然科学基金82003559
2023-07-17(万方平台首次上网日期,不代表论文的发表时间)
共11页
485-495