10.3969/j.issn.1006-9348.2014.07.060
基于近邻噪声处理的KNN缺失数据填补算法
在优化算法的研究中,针对KNN算法对缺失数据的填补效果会因为原始数据中存在噪声而受到严重影响的问题,根据待填补缺失数据最近邻的近邻关系,提出了一种新的缺失数据填补算法——ENN-KNN(Eliminate Neighbor Noise k-Nearest Neighbor).通过比较待填补缺失数据每个最近邻的真实近邻程度能够有效地识别潜在的噪声最近邻.最后使用所有非噪声最近邻对待填补缺失数据进行填补,从而消除了噪声最近邻对填补结果的影响.通过观察四组UCI数据集的仿真结果,可知ENN-KNN算法的填补准确性总体上要优于KNN算法.
缺失数据填补、近邻、噪声最近邻
31
TP391.9;TP18(计算技术、计算机技术)
北京市自然科学基金7110001
2014-09-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
264-268