基于LASSO回归与随机森林算法的2型糖尿病发病风险因素分析
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13421/j.cnki.hjwsxzz.2023.07.002

基于LASSO回归与随机森林算法的2型糖尿病发病风险因素分析

引用
目的 基于 LASSO回归与随机森林算法分析 2 型糖尿病的发病风险因素,为临床决策提供参考.方法 以中国健康与养老追踪调查数据库 2011 年和 2015 年的数据进行队列研究,调查 45 岁及以上人群 2 型糖尿病的风险因素,共纳入3803 名研究对象.研究以人口学变量、生活习惯、血生化指标、2010-2015 年气象数据、空气质量监测数据为自变量,糖尿病结局为因变量,采用 LASSO回归与随机森林重要性排序进行特征变量选择,构建随机森林预测模型并进行效能评价.结果 经随机森林算法分析,空腹血糖、相对湿度、腰围、体质指数、黑碳、硝酸盐、风速、总胆固醇、温度和供暖燃料是 2 型糖尿病排名前 10 的重要危险因素.结合 LASSO 回归与随机森林变量重要性排序构建预测模型.经十折交叉验证,模型灵敏度为62.1%、特异度为 98.8%、准确度为 95.4%、阳性预测值为 89.6%、阴性预测值为 96.0%,AUC达 84.8%.决策曲线结果显示,模型在阈值 0~0.85 范围内具有较高的净收益率.结论 高龄、女性、肥胖情况、血检监测数据异常、高血压或卒中病史和环境污染物暴露可能指示 2 型糖尿病的发生发展,为临床医生对糖尿病高危人群的早期干预提供一定参考依据.

2型糖尿病、风险因素、随机森林、回顾性队列研究

13

R12(环境卫生、环境医学)

国家自然科学基金82003559

2023-07-17(万方平台首次上网日期,不代表论文的发表时间)

共11页

485-495

相关文献
评论
暂无封面信息
查看本期封面目录

环境卫生学杂志

2095-1906

11-6000/R

13

2023,13(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn