10.3969/j.issn.1000-3428.2010.22.028
海量中文短信文本密度聚类研究
根据短信文本的特性,给出一种基于密度的中文短信聚类的方法,该方法将文本数据中具有高密度的区域划分为簇,构造一个可达相似度的升序排列的种子队列存储待扩张的短信文本,选择大阈值相似度可达的对象,即快速定位稠密空间的文本对象使较高密度的簇优先完成.实验结果表明,该聚类方法比K-means 提高10 倍左右的效率.
密度、簇、邻域、短信文本、聚类
36
TP311(计算技术、计算机技术)
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
81-82,85