10.3969/j.issn.1008-0570.2006.27.020
一种基于敏感站点处理的Web信息检索系统
本文设计实现了一种Web信息检索系统,面向有特定需求的特殊用户群,采用基于web站点处理的情报采集策略.先对各站点页面随机采样,提取出包含敏感信息页面的web站点,再采集敏感站点中的相关页面生成本地敏感资源库,并对库中的文本页面用改进的TFIDF算法分析处理,以满足用户的查询.该系统能够提高Web页面信息的检索精确度和检测更新率,并可据某一专题方向对Web站点进行简单的自动分类.
Wen、信息检索、敏感站点、TFIDF
22
TP3(计算技术、计算机技术)
2006-11-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
56-58