10.3969/j.issn.1003-3254.2010.03.026
基于主题短语的搜索引擎结果聚类
为了解决搜索引擎检索结果中的主题混杂现象,帮助用户快速准确地定位到有价值的信息,提出基于主题短语的搜索引擎结果聚类方法.首先从检索结果中提取查询词并与相邻词语组成主题短语,建立包含高频独立词语及主题短语的混合向量空间模型,同时引入同义词词林对特征项进行语义扩充,最后采用改进的k-means聚类算法对搜索结果进行聚类,并为各个类别提取类别标签.实验结果表明,该算法能有效提高聚类结果的准确率.
搜索引擎、聚类、主题短语、同义词扩展、k-means算法
19
TP3;G25
2010-04-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
107-110