10.3969/j.issn.1673-629X.2012.09.051
一种轻量级中文搜索引擎模型的设计与实现
首先详细介绍了一种建构在PC Windows平台上的轻量级中文搜索引擎系统模型的总体设计,然后采用基于多线程技术的广度优先遍历法及最大匹配法和最小匹配法相结合的中文分词法等技术进行了各个主要功能模块的具体设计和实现,对模型进行了基于多线程的网络爬虫、用户接口等测试.测试实验结果表明:构建并实现的轻量级中文搜索引擎系统模型能较好地实现一个简单中文搜索引擎所具有的基本功能,系统界面简单实用,具有较高的资源检索率并能够保证检索结果的准确性.
网络爬虫、URL库、中文分词、倒排文件索引、多线程
22
TP31(计算技术、计算机技术)
河南省科技基础与前沿技术研究计划项目112300410307
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
201-204,209