10.3969/j.issn.1001-3695.2007.07.016
一种对英文字符串进行分词的方法
对Aho-Corasick算法略作改变,用一个收词丰富的有优先级的字典构造Aho-Corasick树,并利用它对英文字符串进行字典匹配.对匹配的结果,利用后缀词按优先级排序的特点设计了一个高效的分词算法.实验证明该算法具有高效性.
字典匹配、英文分词、后缀词
24
TP311(计算技术、计算机技术)
国家重点基础研究发展计划973计划G20000263;广东省广州市科技攻关项目B2-109-550
2007-07-30(万方平台首次上网日期,不代表论文的发表时间)
共3页
52-54