动态最近邻聚类算法的优化研究
针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesian informationcriterion)的优化方法.通过DBSCAN算法对初始数据集进行预处理,去除噪声数据.在参数空间内逐步调整聚类半径,利用最近邻聚类算法对数据集进行聚类,并计算每次聚类结果的贝叶斯信息测度值.比较各次聚类结果的贝叶斯信息测度值,最大贝叶斯信息测度值对应的聚类即为最优聚类结果.实验结果表明,优化的最近邻聚类算法很好地解决了合适的聚类半径选取问题.
数据挖掘、密度聚类算法、贝叶斯信息测度、最近邻聚类、优化
32
TP301.6(计算技术、计算机技术)
国家863高技术研究发展计划基金项目2008AA12Z301;安徽省教育厅自然科学基金项目KJ2008B103
2011-09-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
1687-1690