10.3969/j.issn.1000-3428.2009.10.066
基于语义的高质量中文短信文本聚类算法
现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想.针对中文短信文本聚类提出一种基于语义的聚类算法.给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文短信文本聚类.实验结果表明,该算法的聚类质量高于传统算法.
短信文本、语义、概念相似度
35
TP311(计算技术、计算机技术)
2009-06-12(万方平台首次上网日期,不代表论文的发表时间)
共3页
201-202,205