10.3969/j.issn.1000-3428.2008.18.014
基于向量空间模型的文本聚类算法
文本聚类是聚类的一个重要研究分支,是聚类方法在文本处理领域的应用.该文探讨了基于向量空间模型的文本聚类方法,提出了一种文本聚类的改进算法--LP算法.同时,基于语料库的实际聚类效果,就维度确定、特征选择等方面提出优化方案.实验证明,LP算法有效地减少了聚类所消耗的时间,实用性和灵活性都较高.
向量空间模型、文本聚类、语料库
34
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目60502032,60402019;教育部新世纪优秀人才支持计划基金资助项目NCET-06-0393
2008-11-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
39-41,44