10.3969/j.issn.1000-7024.2014.06.069
基于Nutch的农业垂直搜索引擎研究
针对传统搜索引擎检索返回结果数量庞大、专业性差、查准率低等问题,在分析研究Nutch开源搜索引擎工作原理的基础上,采用基于词库的正向最大匹配分词算法实现中文分词、基于关键词的向量空间模型实现主题相关性判别、基于PageRank排序算法改进结果排序等对Nutch进行二次开发,并将农业领域本体应用于搜索引擎的信息采集及过滤、信息检索以及相关词推荐等各个阶段,设计并实现了基于Nutch的农业垂直搜索引擎.实验结果表明,基于Nutch的农业垂直搜索引擎可以提高用户检索的查准率,满足用户检索的专业性需求.
垂直搜索引擎、主题相关性判别、PageRank算法、本体、相关词推荐
35
TP393(计算技术、计算机技术)
“十二五”国家科技支撑计划基金项目2011BAD21B05、2012BAH30F00、2012BAH30F01
2014-07-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
2239-2243