10.3969/j.issn.1000-3428.2006.12.079
基于语景图的主题爬取器的初步设计
介绍了一个基于语景图的Web主题爬取器的初步设计.描述了NB分类器的文本学习的向量空间模型--Bernoulli模型及Naive Bayes分类器设计提出了简化的前端队列优先排序的设计方案,即下载文档的归一化文档向量与查询向量的余弦相似度,作为层内下载文档的排序准则,以便与各层队列中文档的类似然率得分排序进行对比.介绍了自动实现爬取结果与主题分类目录的集成设想.
主题爬取、机器学习、语景图
32
TP393.07(计算技术、计算机技术)
2006-07-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
208-209,228