基于XGBoost方法的常见人体农兽药及化学污染物暴露与糖尿病的相关性研究
目的 基于Lasso变量筛选和XGBoost模型探讨人体农兽药及化学污染物暴露水平与糖尿病患病风险相关性.方法 2018-2019年,在中国石家庄和杭州进行的"降低成年超重者营养相关慢性病风险的适宜身体活动量研究"调查,选取86例糖尿病患者与410例非糖尿病患者样本并提取问卷调查中个人基本情况数据、体格测量、血生化数据和血清农兽药及化学污染物暴露浓度数据.采用Lasso筛选变量,再分别引入逻辑回归模型与XGBoost模型进行拟合,比较AUC评估拟合效果,并进行变量重要性排序.结果 Lasso筛选出2-乙基己基二苯基磷酸酯、全氟辛酸与全氟十一烷酸3种农兽药及化学污染物暴露与人群糖尿病患病有关,重要性排序为全氟辛酸>2-乙基己基二苯基磷酸酯>全氟十一烷酸,XGBoost模型(AUC=0.83)显著优于逻辑回归模型(AUC=0.64)(P<0.05).结论 Lasso适用于糖尿病患病影响因素的筛选,且XGBoost模型具有较好的复杂数据拟合能力.2-乙基己基二苯基磷酸酯、全氟辛酸与全氟十一烷酸是人群糖尿病患病的重要影响因素.
机器学习、糖尿病、农兽药残留、化学污染物暴露、XGBoost
35
R155(营养卫生、食品卫生)
国家重点研发计划;国家自然科学基金;国家自然科学基金
2023-09-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
652-657