连续型数据的辨识矩阵属性约简方法
属性约简是粗糙集理论在数据处理方面的重要应用,已有的针对连续型数据的属性约简算法主要集中在基于正域的贪心算法, 该方法只考虑了一致样本和其他样本的可辨识性,而忽略了边界样本点间可区分性.为了克服基于正域算法的缺点,提出了连续型数据的辨识矩阵属性约简模型,该模型不但考虑了正域样本的一致性,同时考虑了边界样本的可分性.基于该模型,分析了属性约简结构,定义了辨识矩阵来刻画特征子集的分类能力,构造了实值型数据的属性约简启发式算法,并利用UCI标准数据集进行了验证.理论分析和实验结果表明,提出的算法能够有效地处理连续型数据,提高了数据的分类精度.
邻域关系、粗糙集、属性约简、辨识矩阵、启发式算法
12
TP391;TP274(计算技术、计算机技术)
国家自然科学基金项目61572082, 61673396, 61473111,61363056;辽宁省教育厅项目LZ2016003;辽宁省自然科学基金项目2014020142;辽宁省高校创新团队计划项目LT2014024
2017-08-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
371-376