10.3969/j.issn.1006-9348.2021.06.079
海量不确定数据集中离群点快速检测方法仿真
由于传统离群点检测方法未对离群点进行判定,从而导致出现了检测速度慢、检测误差大的问题,为此提出一种海量不确定数据集中离群点快速检测的方法.优先判定出不确定数据集中的离群点,利用点排序识别聚类结构(Ordering points to identify the clustering structure)算法完成,确定待检测离群点所需参数,计算出离群点的离群属性,根据离群属性计算结果,引入邻域密度构建离群点快速检测模型,设定模型中离群点检测阈值,实现不确定数据集中离群点的快速检测.由仿真结果得出,与传统检测方法相比,提出的方法算法运行耗时降低了50%以上,离群点的判定准确度更高,漏检、误检率大大降低,实现了离群点精度高、速度快的检测,对数据挖掘与预处理有显著的实践意义.
不确定数据集、离群点快速检测、离群属性、邻域密度、离群点聚类
38
TP393(计算技术、计算机技术)
2021-07-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
378-382