10.3969/j.issn.1000-7024.2014.11.048
基于双哈希结构的整词二分词典机制
为提高逆向最大匹配分词算法的速率,分析传统的整词二分词典机制,针对哈希结构尾字词典的不足,提出一种基于双哈希结构的整词二分词典机制,并改进对应的逆向最大匹配算法.利用记录词长的尾字词典机制,使用双哈希结构保存词条,降低词典的词条匹配时间复杂度.实验结果表明,该词典机制将逆向最大匹配算法的分词速率提高近一倍.
中文分词、词典机制、尾字词典、哈希结构、逆向最大匹配算法
35
TP391(计算技术、计算机技术)
天津市科技型中小企业创新资金基金项目12ZXCXGX33500
2015-01-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
3956-3960