10.13663/j.cnki.lj.2014.12.003
LUCENE搜索算法剖析及优化研究
介绍了开源搜索引擎Lucene的索引与搜索过程,剖析了Lucene的基于向量空间模型的文档相关度模型和基于TF-IDF的权重计分算法,在分析其文档相关度分值计算公式的基础上,指出了可通过修正评分机制和优化向量空间模型的算法来改进Lucene的搜索功能和性能的途径.并提出了一种基于离散随机最优化的快速搜索算法,以期提升Lucene在大文档集实时搜索时的性能.
Lucene 搜索算法、向量空间模型、TF-IDF、离散随机最优化
TP391;O211.63;G354.4
国家社会科学基金;上海市教委科研创新项目
2015-02-02(万方平台首次上网日期,不代表论文的发表时间)
17-23