10.3969/j.issn.1673-629X.2011.03.019
一种基于引力的分层聚类算法
传统的分层聚类算法在聚类过程中,仅使用样本间的距离作为相似度的唯一标准,其描述过于单一.考虑到宇宙中星系的形成过程本质也是一种聚类过程.星系之间吸引力是靠万有引力作用.将万有引力思想引入分层聚类中,提出一种基于引力的层次聚类算法HCBG(Hierarchical Clustering Base Gravity),从样本间的距离和类簇的大小两个方面更加精确地刻画相似度.把分层聚类的过程看成样本点之间依据"万有引力"自发吸引的过程.采用UCI机器学习数据库的Iris,Wine和Glass数据集,实验结果表明,提出的HCBG算法的聚类结果比经典的基于距离的层次聚类HC(Hierarchical Clustering)提高5%~10%左右.
引力、分层聚类、相似度
21
TP301.6(计算技术、计算机技术)
安徽省自然科学基金项目KJ2008B092
2011-06-23(万方平台首次上网日期,不代表论文的发表时间)
共3页
76-78