一种高效混合属性离群检测算法
离群检测是数据挖掘领域的一个重要内容,它为分析各种海量、复杂、含有噪声的数据提供了新的方法.对离群簇进行了定义并据此提出一种离群检测方法,该方法增量式地对原始数据集进行聚类,在得到的簇中寻找离群簇.根据提出的簇间差异性度量,新方法可处理混合属性数据集.同时探讨了参数取值.基于人工数据集和真实数据集上的实验表明,新方法检测离群点具有精度高、速度快的优点,适用于大规模数据集.
离群检测、混合属性、离群簇
31
TP18(自动化基础理论)
国家自然科学基金项目60673191,10871040;河南省教育厅自然科学基础研究计划项目2010A520033
2011-03-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
2282-2286