10.3969/j.issn.1000-7024.2012.04.030
基于DBSCAN的最优密度文本聚类算法
为有效地弥补全文搜索引擎的不足,提出了一种动态求解的最优密度聚类算法并加以实现.该算法构造了一颗簇关系树,将两种典型聚类算法:密度聚类算法DBSCAN和层次聚类算法BIRCH进行有效结合,对聚类参数ε进行动态求解,以达到参数ε的最优.与其它文本聚类算法相比,该算法的查询结果与用户感兴趣的主题相关度较大,对具有二义性的关键词有较高的查准率,能有效提升搜索引擎的查询效率,加快用户搜索信息的速度.
搜索引擎、文本聚类、密度聚类、簇关系树、动态聚类
33
TP391.3(计算技术、计算机技术)
2012-06-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
1409-1413