文本聚类算法的设计与实现
为了有效地提高丈本聚类的质量和效率,在对已有的层次聚类和K-means算法分析和研究的基础上,针对互联网信息处理量大、实时性高的特点,设计并实现了一种用于高维稀疏相似矩阵的文本聚类算法.该算法结合了层次聚类和K-means聚类的思想,根据一个阈值来控制聚类算法的选取和新簇的建立,并通过文本特征提取和文档相似度矩阵计算实现文本聚类.实验结果表明,该算法的召回率和正确率更高.
中文文本、文本分类、聚类算法、层次聚类、K-means
31
TP301(计算技术、计算机技术)
2010-06-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
2013-2015,2019