10.3760/cma.j.issn.0253-9624.2009.05.021
决策树技术在农村3岁以下儿童贫血状况研究中的应用
目的 探讨决策树技术在农村儿童贫血研究中的应用.方法 在SAS 8.2软件的Enterprise Miner模块中,将3000例农村地区3岁以下断奶儿童的卫生保健研究数据按75%和25%分为初步拟合模型的训练集与调整模型的验证集,利用Gini杂质函数建立CART算法决策树模型,以误分率、ROC曲线、Root ASE和诊断图建立的模型进行评价.通过模型中的变量以及变量在模型中的上下层级关系,来分析农村地区3岁以下断奶儿童贫血发生的影响因素,以及影响因素间的相互作用.结果 CART决策树模型中训练集和验证集的误分率分别为21.2%、21.9%,Root ASE为0.399、0.404;模型的ROC曲线高于参考线,有较大的曲线下面积;诊断图中实际值和预测值相一致的比例最大,正确分类的观察符合率明显高于错误分类的观察符合率;决策树模型共筛选出9个影响儿童贫血的重要因素,并按影响因素间的相对重要性进行了排序,其中母亲是否贫血(1.00)是最重要的影响因素,其他的是儿童的月龄(0.75)、儿童的断奶时间(0.53)、孩子母亲的年龄(0.32)、添加鸡蛋的时间(0.26)、项目县分类(0.26)、添加鲜奶的时间(0.16)、家庭人口数(0.13)和母亲受教育年限(0.12).结论 决策树技术为有效分析儿童保健研究方面的资料提供一种新的思路.
决策树、贫血、儿童、误分率
43
R1(预防医学、卫生学)
卫生部与联合国儿童基金会资助项目YH001;国家自然科学基金30771866
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
434-437