10.3969/j.issn.1007-757X.2011.08.014
基于Lucene二次全文检索系统的设计与实现
通过Lucene API实现对PDF文档的一次全文检索,为了实现更精确的搜索关键词定位,设计并实现了一种新的二次索引算法,该二次索引带有关键词的页码、坐标及其上下文等信息.利用该二次索引可将检索结果定位到PDF文档的具体页,然后在页面上标示出关键字的具体位置,使对PDF文档的二次检索达到了类似Google Book的图书检索效果.系统测试结果说明系统具有良好检索性能,有较高的查全率和查准率,能够满足站内用户快速检索的需求.通过扩展,系统可以适应C/S和B/S这两种应用需求,有广阔的应用前景.
全文检索、二次索引、二次检索、Lucen
27
TP311(计算技术、计算机技术)
全文检索技术在网络教育中的应用研究10YKZ048;教育部特色专业建设点TS11772
2012-01-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
39-41