10.3778/j.issn.1002-8331.2010.04.041
章回小说的有意义串发现算法
已有有意义串发现算法对于大规模语料中频繁出现的有意义串发现效果较好,而对于语料规模小,或者出现频次较低的有意叉串识别效果不够理想.根据章回小说有意义串出现的特点,提出有意义串的局部性原理,并给出了字符串局部性的有效度量方式.将字符串的局部性和语用独立性结合起来,使用局部性和独立性共同描述字符串为有意义串的可能性.实验结果表明:该方法对于章回小说有意义串发现的准确率高于已有方法,同时能够更有效地发现较多的低频有意义串.
有意义串、章回小说、局部性度量、局部性约束、低频串
46
TP301.6(计算技术、计算机技术)
2010-04-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
129-131,162