10.3969/j.issn.1009-3044.2010.22.046
重复网页检测算法综述
重复网页检测是搜索引擎的关键技术之一,算法的选择直接影响搜索引擎的检索效率.该文详细分析了现目前常用的重复网页检测算法,并从算法所采取的两个步骤(特征提取,特征比较)入手,比较了各算法的异同与其各自的优缺点,为进一步优化算法找出思路.
重复网页检测、特征提取、特征比较
6
TP311(计算技术、计算机技术)
2010-09-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
6237-6239