10.3969/j.issn.2095-6835.2011.02.068
基于高权重词集的增量聚类算法研究
文本聚类作为一种无监督的机器学习方法,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注.本文以网络论坛的话题发现和追踪为背景,通过对论坛中的帖子进行聚类分析而获取话题.本文以层次聚类算法为基础,进行改进,提出高权重词集的概念,基于此设计并实现了增量聚类算法,通过实验验证了该算法适应动态数据以及时间、空间复杂性上的优越性,证明了系统在设计的时候采用的系统架构的合理性及必要性.
文本聚类、高权重词集、层次聚类、增量聚类
27
TP301(计算技术、计算机技术)
2014-07-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
170-172