10.3969/j.issn.1006-2475.2012.11.042
基于Solr的分布式全文检索系统的研究与实现
随着当前网络信息资源的急剧膨胀,传统的检索系统已经难以在处理海量数据时提供高效的、可靠的服务.针对该情况,设计并实现一个基于Solr的分布式全文检索系统.系统通过网络爬虫抓取网页信息,将抓取的信息储存为文本文件;然后利用Solr索引处理模块,在多台计算机节点上并行创建索引,有效地提高系统建立索引的速度;系统通过Zookeeper管理集群,将搜索模块设计为分布式,有效地提高检索性能;最后设计了友好的用户界面.目前,系统可以在百万数据量的环境下稳定运行,具有较强的实用价值.
全文检索、Solr、分布式、Zookeeper
TP311.133.1(计算技术、计算机技术)
2013-03-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
171-176