10.3969/j.issn.1000-1220.2007.07.034
一种适用于汉语的索引文件结构
本文给出一种以词语为索引项的索引文件存储结构,以及基于这种结构的索引查询算法.首先分析中文索引库的分布规律,接着在此基础上设计了一种逆序存储的三层索引结构,这种结构在创建索引时能根据词语频率自动调整存储顺序,最后给出一种基于自动机和逆向最大匹配的索引查询算法.实验系统TIFS将三层索引结构与B树、哈希方法在时间和空间复杂度方面进行对比,结果表明,对于大规模的中文文本检索,三层索引结构的综合效果最好.
三层索引结构、汉语索引、信息检索、自适应算法
28
TP391.1(计算技术、计算机技术)
辽宁省自然科学基金2004D110
2007-07-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
1314-1317