10.16208/j.issn1000-7024.2016.03.032
基于属性重要度的数据补齐方法
为更好地处理不完备决策信息系统的缺失值,提出一种基于属性重要度的增量式数据补齐算法。基于同类数据分布的内聚性和异类数据的耦合性定义属性的重要度,优先填补重要属性;提出一种属性重要度定义;采取加权欧氏距离和余弦相似从距离和角度两方面同时衡量样本的相似度;为避免不同类别数据的相互干扰,将相似样本的搜索范围限定为同类别的完备样本集。实验采用7个UCI标准数据集比较该算法和其它算法,实验结果表明,该算法能有效提高补齐后的分类识别率。
不完备决策系统、增量式、数据补齐、属性重要度、相似样本
37
TP18(自动化基础理论)
国家自然科学基金项目61070049、61202027;国际科技合作基金项目2012DFA11340;北京市自然科学基金项目4122015;电子系统可靠性技术北京市重点实验室2012年阶梯计划基金项目Z121101002812006
2016-04-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
725-730