10.11772/j.issn.1001-9081.2020060851
基于k-means++的动态构建空间主题R树方法
现有的R-树空间聚类技术在通常通过随机指定或者计算空间数据间的欧氏距离来选取聚类中心,而未考虑空间数据间的主题相关度.这些导致聚类结果受初始k值影响,空间数据间的关联仅仅是基于地理位置的.针对此种情况,提出了一种基于k-means++的动态构建空间主题R树(TR-tree)方法.首先,在传统的k-means++算法上,通过聚类测度函数动态地确定k个聚类簇,并在聚类测度函数中引入潜在狄利克雷分布(LDA)模型来计算每个空间数据文本的主题概率,从而加强空间数据间的主题关联度;其次,通过主题概率选取概率最大的聚类中心;最后,构建TR-tree,并且在构建时动态分配空间数据.实验结果表明:虽然构建R-树的时间略有增加,但该方法在索引效率及节点间关联度上较仅仅基于地理位置聚类构建R-树的算法有明显提升.
R-树、k-means++、聚类、索引效率、潜在狄利克雷分布模型
41
TP391.1(计算技术、计算机技术)
镇江市重点研发计划产业前瞻与共性关键技术项目GY2017025
2021-03-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
733-737