10.3969/j.issn.1672-9722.2019.05.038
基于Web的Lucene全文搜索排序算法的研究
在计算机与网络技术支撑日趋成熟的情况下,企业内部充斥着大量的电子信息.为了能够满足企业对高效、准确地检索出所需讯息的需求.搜索引擎技术的革新、发展被提上日程,而人们在文本检索中使用的排序算法又是影响搜索引擎质量的一个不可忽略的因素.原始的Lucene搜索引擎使用基于向量模型的排序算法,然而这种原始的算法在自然语义理解上面有很大的弊端.由此论文在剖析Lucene组织结构、文档排序算法以及对比经典排序算法DirectHit、PageRank的基础之上,提出了一种新型的Vector-PageRank排序算法,算法针对基础算法的不足之处进行优化,并在此算法的基础之上设计实现了一款适合企业的搜索引擎系统.实验结果表明,经过优化后的Lucene的排序算法精确度更高,更符合用户的关切度.
Lucene向量空间模型、相似度、Vector-PageRank
47
TP391(计算技术、计算机技术)
2020-01-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
1208-1211,1239