10.3969/j.issn.2095-6835.2010.15.002
类关联词约束的K-Means半监督文本聚类方法
提出了一种利用类关联词和K-Means聚类算法实现对文本文档进行分类的方法.类关联词是与类主题相关、能反映类主题的单词或短语.根据文档中包含的类关联词,形成初始聚类中心.在聚类算法过程中,类关联词提供的信息被用来约束待分类文档与聚类中心的相似度比较,加快了算法的执行.实验证明了算法的有效性.
文本聚类、文本分类、类关联词、K-Means
26
TP181(自动化基础理论)
2014-07-08(万方平台首次上网日期,不代表论文的发表时间)
共2页
4-5