10.3979/j.issn.1673-825X.2020.01.013
Lucene索引段合并优化策略
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点.Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量.针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作.为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并.通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率.
Lucene、索引段合并、负载系数、索引段相似度、最优合并索引段
32
TP391(计算技术、计算机技术)
重庆市基础科学与前沿技术研究项目cstc2017jcyjAX;重庆市教委科学技术研究项目KJ1704085;重庆邮电大学博士启动基金A2015-17
2020-04-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
105-112