基于Lucene的中文全文检索系统的研究与设计
提出了一种基于Lucene的中文全文检索系统模型.通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度.在检索结果的处理上,采用文本聚类的办法,使检索结果分类显示,提高了用户的查找的效率.实验数据表明,该系统在检索中文网页时,在效率,精度和结果处理等方面性能明显提高.
全文检索、网页正文提取、中文分词模块、索引文档预处理、文本聚类
29
TP393(计算技术、计算机技术)
2008-12-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
5083-5086