10.3969/j.issn.1673-4785.2010.02.009
信息熵度量的离群数据挖掘算法
离群数据挖掘是为了找出隐含在海量数据中相对稀疏而孤立的异常数据模式,但传统的离群数据挖掘方法受人为因素影响较大.通过引入基于信息熵的离群度量因子,给出一种离群数据挖掘新算法.该算法先利用信息熵计算每个数据对象的离群度量因子,然后通过离群度量因子来衡量每个对象的离群程度,进而检测离群数据,有效地消除了人为主观因素对离群检测的影响,并能很好地解释离群点的含义.最后,采用UCI和恒星光谱数据作为实验数据,通过对实验的分析,验证了该算法的可行性和有效性.
离群数据、信息熵、离群度量因子、数据挖掘
5
TP311(计算技术、计算机技术)
山西省青年科学基金资助项目2008021028
2010-06-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
150-155