10.3969/j.issn.1003-3254.2011.09.017
一种基于NMFSC的文本聚类方法
通过分析文本的特征,提出了一种基于稀疏约束非负矩阵分解(NMFsC)的文本聚类新方法.该方法用NMFSC分解词-文本矩阵来降低特征空间的维度,并依照稀疏约束更好地控制稀疏度,然后利用簇中文本的相似性进一步细化簇.实验表明,与基于k-means的文本聚类方法和基于NMF的文本聚类方法相比,此方法具有较高的归一化互信息值(NMI),从而具有良好的聚类性能.
文本聚类、细化簇、非负矩阵分解、稀疏表示、归一化互信息值
20
TN9;TP3
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
78-81,156