10.3969/j.issn.1007-757X.2014.04.006
网络搜索引擎的设计与实现
提出了一个基于Java的全文搜索引擎设计方案,该方案包括基于HTMLParser设计的网络蜘蛛、基于Lucene设计的索引器和检索器3部分.网络蜘蛛采用标签爬行策略和宽度优先遍历算法,实现了对网页的遍历;索引器对网络蜘蛛抓取到的网页创建索引,建立了索引数据库;检索器根据用户输入的关键词对索引数据库进行检索并将检索结果反馈给用户.检索实验证明,该搜索引擎是一个比较高效的检索工具.
搜索引擎、网络蜘蛛、索引器、检索器
30
TP393(计算技术、计算机技术)
2014-05-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
22-24