Lucene索引段合并优化策略
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3979/j.issn.1673-825X.2020.01.013

Lucene索引段合并优化策略

引用
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点.Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量.针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作.为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并.通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率.

Lucene、索引段合并、负载系数、索引段相似度、最优合并索引段

32

TP391(计算技术、计算机技术)

重庆市基础科学与前沿技术研究项目cstc2017jcyjAX;重庆市教委科学技术研究项目KJ1704085;重庆邮电大学博士启动基金A2015-17

2020-04-10(万方平台首次上网日期,不代表论文的发表时间)

共8页

105-112

相关文献
评论
暂无封面信息
查看本期封面目录

重庆邮电大学学报(自然科学版)

1673-825X

50-1181/N

32

2020,32(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn