10.3969/j.issn.1002-3208.2013.05.07
基于数据挖掘的HIV感染者CD4细胞计数预测模型
目的 探索利用数据挖掘技术预测CD4+T淋巴细胞计数<350个/μL和<500个/μL的可能性和效果,从而为CD4+T淋巴细胞计数预测模型的选取提供参考依据.方法 收集345名HIV感染男男性接触者的2837例总淋巴细胞计数、血红蛋白、血小板计数、白细胞计数和红细胞计数,分别建立基于Logistic回归、线性判别分析、决策树、反向传播多层感知机和径向基函数神经网络的预测模型,并对预测效果进行10折交叉验证.利用敏感度、特异度、阳性预测值、阴性预测值和受试者操作特征(ROC)曲线下面积对5种预测模型的性能进行评价.结果 上述5种模型预测CD4< 350个/μL的ROC曲线下面积(Az)分别为0.698、0.697、0.706、0.746和0.745,预测CD4<500个/μL的Az值分别为0.735、0.737、0.724、0.707和0.714,均高于单独使用总淋巴细胞计数(Az值分别为0.657和0.691)进行预测的效果.结论 数据挖掘模型在预测CD4 +T淋巴细胞计数方面具有一定水平,不同模型在完成不同预测任务时表现出了不同性能.
HIV、CD4+T淋巴细胞计数、外周血组分、数据挖掘、预测模型
32
R318.04;R759;TN911.73(医用一般科学)
北京市科委重大专项课题D0906003040591
2013-11-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
479-484