10.3969/j.issn.1003-3254.2015.04.050
基于0-1规划的规则中文文件碎片自动拼接技术
为了实现规则中文文件碎片的拼接,研究了规则碎片文件中汉字文本的特征,提出了文件碎片中文本行信息的提取方法,定义了基于L1-norm 的碎片边界差异度概念,建立了基于0-1规划的文件碎片拼接模型,并运用聚类分析降低了算法复杂度。与现有同类算法相比,本文的算法无需使用人工干预即可完成正确拼接。
规则碎片拼接、0-1规划、聚类分析、文本特征提取、L1-norm
H31;TP3
陕西省教育科学“十二五”规划项目SGH13481
2015-05-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
270-273