10.3969/j.issn.1672-9722.2021.09.006
改进的ReliefF在ICP特征选择中的应用
妊娠期肝内胆汁淤积症(ICP)是妊娠期严重危害母婴的并发症,原始的ICP数据集中含有大量的生物标志物信息,特征间通常会存在相关性,且不同妊娠结局间的人数差异较大.论文针对ICP数据集的高冗余和非平衡性,提出了一种新的特征选择算法—SC-ReliefF.SC-ReliefF算法在ReliefF的基础上,根据类内平均距离提出了新的样本选择方法,能很好地适应非平衡数据的特点;同时为了减少特征冗余,SC-ReliefF算法引入余弦相似度,将其作为特征冗余度的度量方式,提出一种去冗余方法,能够得到更小的特征子集.在医院提供的临床数据实验表明,SC-ReliefF算法与ReliefF、mRMR和RS-ReliefF相比得到的ICP特征子集规模较小,且在SVM和BP-NN上具有较好的分类效果,能够提升学习的效率.
ICP;特征冗余;特征选择;余弦相似度;ReliefF
49
TP391(计算技术、计算机技术)
江苏省重点研发计划社会发展项目;无锡市卫生计生委科研项目
2021-10-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
1758-1762