10.3969/j.issn.1000-3428.2011.16.013
基于Lucene的搜索引擎设计与实现
针对目前教育网庞大的FTP资源检索困难的问题,提出一种基于EdtFTPJ和Lucene的FTP搜索引擎的设计和实现方案.该方案整体上采用基于Struts1.2框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,索引模块应用倒排索引方法,系统的分词算法使用基于字典的正向最大匹配中文分词法.实验结果表明,该方案具有较高的资源检索率,同时能够保证检索结果的准确性.
FTP搜索引擎、Lucene框架、模型-视图-控制器、有限状态自动机、倒排索引
37
TP311.13(计算技术、计算机技术)
国家自然科学基金资助项目60841004,60971110;郑州大学创新性实验基金资助项目2009cxsy100
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
39-41