10.3969/j.issn.1673-629X.2011.02.008
一种改进的DBSCAN密度算法
DBSCAN算法是一种基于密度的聚类算法,算法存在许多优点,也存在一些不足.比如对输入参数Eps敏感,DB-SCAN由于采用全局Eps值,所以在数据密度不均匀和类间距离相差比较大的情况下,聚类质量会受到很大影响.文中主要针对算法输入参数Eps以及数据密度不均匀问题加以改进,提出了一种新的数据分区方法,通过对k-dist图纵坐标距离值单维度聚类,然后对比横坐标实现分区,使每个分区的数据尽可能均匀.实验证明,改进算法明显缓解了全局Eps导致的聚类质量恶化问题,聚类结果更加准确.
DBSCAN算法、Eps、数据分区、K-dist图
21
TP301.6(计算技术、计算机技术)
安徽省教育科研重点项目KJ2009A57
2011-06-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
30-33,38