10.3778/j.issn.1002-8331.2009.34.044
基于Isomap的中文短信文本聚类算法
给出的算法思想是首先计算出中文短信的相似度,再通过使用Isomap方法得到短信在语义空间中的嵌入情况,然后将短信在低维嵌入上进行聚类分析.该算法克服了短信的传统聚类分析在表示层次上遇到的困难,也克服了词频统计法不能将内容意思相似的短信聚集在一起的缺点,实验表明该算法是行之有效的.
短信聚类、Isomap算法、语义空间
45
TP311(计算技术、计算机技术)
2010-01-25(万方平台首次上网日期,不代表论文的发表时间)
共3页
144-146