特征选择方法中三种度量的比较研究
不同类型数据中特征与类别以及特征与特征之间存在一定的线性和非线性相关性.针对基于不同度量的特征选择方法在不同类型数据集上选取的特征存在明显差别的问题,本文选择线性相关系数、对称不确定性和互信息三种常用的线性或非线性度量,将它们应用于基于相关性的快速特征选择方法中,对它们在基因微阵列和图像数据上的特征选择效果进行实验验证和比较.实验结果表明,基于相关性的快速特征选择方法使用线性相关系数在基因数据集上选取的特征集往往具有较好分类准确率,使用互信息在图像数据集上选取的特征集的分类效果较好,使用对称不确定性在两种类型数据上选取特征的分类效果较为稳定.
特征选择、线性相关系数、对称不确定性、互信息、基于相关性的快速特征选择方法
23
TM391.1(电机)
黑龙江省普通高等学校新世纪优秀人才培养计划1155-ncet-008;黑龙江省教育科学规划课题GBC1211062;黑龙江省自然科学基金QC2015084
2018-03-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
111-116