10.3969/j.issn.1000-3428.2010.13.015
Nutch中网页排序效果的改进方法
Nutch是一个Java实现的开源搜索引擎.针对目前Nutch对中文进行单字切分且没有实现PageRank计算的缺点,改进PageRank算法,设计并实现基于MapReduce的PageRank计算方法,对Nutch中文分词进行改进,加入JE中文分词器.实验结果表明,改进后的Nutch具有更高的查询结果准确率和中文网页排序效果.
Nutch搜索引擎、MapReduce模型、PageRank算法、JE中文分词器
36
TP391(计算技术、计算机技术)
广西自然科学基金资助项目桂科自0832059
2010-09-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
42-44