10.3969/j.issn.1000-3428.2008.15.033
基于Nutch的XML网站全文搜索引擎实现
普通搜索引擎的网页抓取程序只能理解常见HTML标签,无法对XML网站的内容做有效解析.该文建立一个包含动态自定义标签的纯XML网站,提出借助XSL样式信息帮助网页抓取程序理解XML网页标签含义的方案,实现了基于Nutch的XML网站全文搜索引擎.
XML信息检索、可扩展样式表语言转换、基于Nutch的搜索引擎
34
TP391(计算技术、计算机技术)
2008-09-24(万方平台首次上网日期,不代表论文的发表时间)
共3页
95-96,107