10.3969/j.issn.1001-3695.2017.02.034
倒排链表多层自索引结构的分析与设计
在大型搜索引擎的查询处理过程中,对索引文件的顺序遍历将导致响应时间过长,自索引结构能够有效解决上述问题.为了进一步缩短查询时间,通过对当前索引文件自索引结构的分析,设计了倒排链表的多层自索引结构.此结构以定长元组为单位,使用迭代的方法提取数据段同步点形成上层自索引;在此基础上,实现了索引压缩与查询系统.基于TREC GOV2数据集的测试结果表明,该系统的各项性能指标均优于不采用自索引结构的查询系统,在不影响结果精度的情况下使检索效率得到大幅提升.
搜索引擎、倒排索引、自索引、随机访问
34
TP391.3(计算技术、计算机技术)
湖南省自然科学基金资助项目2016JJ2007
2017-05-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
473-476