10.3969/j.issn.1000-3428.2004.15.009
相似文本的快速搜索
相似文本的快速搜索是大规模文本处理需要解决的基本问题.从两方面改进了Udi的相似文本搜索方法,通过Hash把集合映射成ID,从而得到更快的集合比较算法,重新定义了相似关系,能够减少误判,同时对有固定格式的文本也有更好的效果.
大规模文本处理、相似文本搜索、复制检测
30
TP391.43(计算技术、计算机技术)
国防预研基金
2004-09-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
22-23,71