10.16208/j.issn1000-7024.2019.03.025
利用聚类分析和离群点检测的数据填补方法
为提高数据填补方法的正确率, 提出利用核K-Means聚类和离群点检测来填补缺失数据的算法 (KKMOD) .用核方法将数据集映射到高维空间, 聚类后形成不同簇, 在同簇内选择与缺失数据最相似的数据进行填补, 使用核K-Means进行离群点检测, 将检测到的离群点去除填补值, 重新放入数据集填补, 算法不断迭代, 直到填补的数据不再检测出离群点.实验结果表明, KKMOD方法能够充分考虑簇内关系, 避免不同簇相互干扰, 提高数据填补算法的正确率.
核方法、聚类分析、缺失数据、数据填补、离群点检测
40
TP391(计算技术、计算机技术)
天津市科技计划基金项目17KPXMSF00140、17ZLZXZF00470;天津市科技基金项目KJCX-KFQ-CXY-2016-003
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
744-747,761