10.3772/j.issn.1000-0135.2011.08.005
基于关键词共现分析的检索结果聚类研究
随着互联网规模的急剧扩张,提升信息检索的效用变得相当困难.本文首先通过特定算法提取每篇文档的关键词,然后运用统计方法计量不同文档的共现关键词并形成相应的共现关键词标签矩阵,最后利用层次聚类算法对共现关键词标签进行聚类并形成相应的层次标签树来构造文档聚类束.该方法可以对源搜索引擎返回的结果进行有效的分类,使用户在更高主题层次上查看检索词的相关信息,准确地找到感兴趣的信息.通过与Lingo算法的比较,显示本文算法所得的标签更具可读性和概括性,同时F-measure评价指标也表明本算法在文本聚类的质量上有了一定的提升.
关键词、共现、聚类、检索结果
30
TP3;G35
教育部人文社会科学重点研究基地重大项目07JJD870220
2011-11-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
819-825