非一致分类数据集的一致化与特征选择
采用不一致性或含有冗余特征的样本数据集往往会降低分类的质量和效率.提出了一种将分类数据集一致化,并在此基础上选择最小特征变量集的方法.该方法首先根据贝叶斯公式,将非一致数据归为最可能的一类,使数据集一致化,然后在一致数据集上,定义类别区分矩阵,选择最小特征变量集,并给出了在类别区分矩阵上搜索最小特征变量集的启发式搜索策略.采用UCI标准数据集的实验结果表明,提出的方法可有效地删除数据集的不一致性,选择的最小特征变量集可准确区分各类数据并降低数据的维数.
数据挖掘、分类、特征选择、数据约简、数据一致化、贝叶斯公式
30
TP391(计算技术、计算机技术)
武汉大学软件工程国家重点实验室开放基金项目SKLSE05-09
2009-06-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
2208-2210