10.19678/j.issn.1000-3428.0059822
面向非平衡数据的癌症患者生存预测分析
针对癌症数据集中存在非平衡数据及噪声样本的问题,提出一种基于RENN和SMOTE算法的癌症患者生存预测算法RENN-SMOTE-SVM.基于最近邻规则,利用RENN算法减少多数类样本中噪声样本数量,并通过SMOTE算法在少数类样本间进行线性插值增加样本数量,从而获得平衡数据集.基于美国癌症数据库非平衡乳腺癌患者数据集对癌症患者的生存情况进行预测分析,实验结果表明,与SVM算法、Tomeklinks-SVM算法等5种常用算法相比,该算法的分类及预测效果更好,其正确率、F1-score、G-means值分别为0.883,0.904,0.779.
疾病预测;机器学习;数据分析;非平衡数据;SMOTE算法
47
TP391(计算技术、计算机技术)
江苏省"双创博士"项目CZ032SC20025
2021-12-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
316-320