10.3969/j.issn.1007-757X.2011.04.017
用于网络搜索引擎的中文分词消岐算法
在正向最大匹配法的基础上,提出了一种便于在网络搜索引擎上使用的消除歧义的方法.通过利用单字词和二字词的高频特性以及不同词条的词频特点,再加上长词优先的原则,来消除在分词中可能会出现的交集型歧义和组合型歧义.实验结果表明:改进的回溯算法,比最大正向匹配法和回溯法的消歧更加有效.对高频交集型歧义字段取样分析结果表明,改进的回溯算法正确率达到75%.
中文分词、消歧方法、交集型歧义
27
TP311(计算技术、计算机技术)
2011-07-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
52-54