两种对URL的散列效果很好的函数
在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列操作.针对两种典型的应用场合,即Web结构分析中的信息查询和并行搜索引擎中的负载平衡,基于一个含有2000多万个URL的序列,进行了大规模的实验评测.说明在许多文献中推荐的对字符串散列效果很好的ELFhash函数对URL的散列效果并不好,同时推荐了两种对URL散列效果很好的函数.
散列、ELFhash、URL、均匀分布、Web挖掘、负载平衡
15
TP314(计算技术、计算机技术)
国家重点基础研究发展计划973计划G1999032706
2004-04-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
179-184