10.3969/j.issn.1007-130X.2007.10.020
基于提取关键词的中文文档复制检测研究
文档复制检测技术在保护知识产权和信息索引中起重要作用,它可以防止剽窃事件的发生,提高互联网检索效率.目前,英文复制检测技术已经比较成熟,但中文复制检测技术研究还处于起步阶段.本文提出一种基于关键词的指纹提取方法;提出k-words方法分解句子;定义了数字指纹树概念,并用数字指纹树来存储指纹.最后,用实验验证了所提出的方法.
指纹、剽窃、文本块、匹配
29
TP309(计算技术、计算机技术)
2007-12-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
63-64,88