10.3969/j.issn.1001-6600.2007.04.028
基于文档指纹的中文复制检测方法
文档复制检测技术是保护知识产权和提高信息检索效率的有效有段.目前,关于英文的复制检测技术已经趋向成熟,但关于中文的复制检测技术才刚刚起步.在此提出基于文档指纹的中文复制检测方法,改进了正向最大匹配分词方法并建立了相应的语料库机制,提出k-words分解句子的方法;定义了两篇文档同粒度指纹矩阵之间的匹配运算.实验结果表明,所提出的方法能高效地进行中文文档复制检测.
指纹、剽窃、文本块、匹配
25
TP309(计算技术、计算机技术)
教育部科学技术基金205014
2007-12-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
112-115