基于质心投影波动的离群点检测算法
离群点检测是数据挖掘研究的一个重要领域.在传统基于近邻的离群点检测方法中,k近邻关系被广泛使用.然而,随着数据分布的多样化和数据维度的增加,基于k近邻关系算法检测离群点的过程中易受不同类簇影响而检测效果不佳.针对以上问题,首先通过引入近邻树代替k近邻关系生成新的邻域集合,提出质心投影的概念用来刻画数据对象与其邻居点的分布特征,其次在数据对象邻居点逐渐增多的过程中,离群点和内部点质心投影变化不同,采用质心投影波动来衡量每个数据对象的离群程度,最终提出了基于质心投影波动的离群点检测算法.通过在人工数据集和真实数据集下进行的实验表明,该算法能有效且较为全面地检测离群点.
数据挖掘、离群点检测、k近邻、近邻树、质心投影波动
28
TP311(计算技术、计算机技术)
河北省创新能力提升计划资助项目20557640D
2023-01-16(万方平台首次上网日期,不代表论文的发表时间)
共10页
3867-3876