10.3969/j.issn.1008-0570.2006.21.103
基于URL聚类的新型web筛选机制研究
由于传统的筛选方法在执行效率和准确率上都不能满足网页信息提取的需要,我们提出了一种新的基于领域知识的筛选方法.这种方法不仅通过网页的内容进行筛选,而且利用网页特点,通过URL聚类的方法进行筛选.实验表明,这种方法提取效率和准确性都要高于传统的算法.
URL、聚类、网页、筛选机制
22
TP3(计算技术、计算机技术)
2006-09-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
291-293