外星语字母词根查找模型的建立
针对外星语字母词根快速查找的问题,提出了外星语字母词根查找模型,该模型的具体方法是基于编辑距离模糊匹配和KMP算法的综合算法.首先利用统计学方法获得符合题意的30段文本,作为数据样本,并将第一段所有的数据映射为一个数组的数据结构且对其进行平移连续切词;然后再利用KMP算法和编辑距离算法将所切词与余下文本段进行模糊匹配;最后,考虑算法的时间复杂性和空间复杂性,对算法进行优化,使其在初步的基础上提高查找片段的速度和数量.
KMP算法、编辑距离算法、模糊匹配、Simhash算法
TP391.1;TN957;G250.252
2019-08-15(万方平台首次上网日期,不代表论文的发表时间)
共1页
22