10.3969/j.issn.1673-1409-C.2009.02.022
改进性的文本聚类算法研究
在互联网技术日益发展的今天,如何快速对海量的文本进行归类是数据挖掘的一项重要课题. 提出了一种改进型的文本聚类算法,计算句子相似度时综合考虑基于词频统计的特征向量表示法和关键词之间的关系,减少了相似度对于输入次序和频数的敏感度,有效地提高了计算小文档和简单句子相似度的准确度和文本聚类结果的准确率、召回率.
文本聚类、特征向量、相似度
6
TP311(计算技术、计算机技术)
2009-10-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
73-75