10.3969/j.issn.1009-3044.2007.08.077
搜索引擎中中文分词的研究
针对目前最常用的分词算法--最大匹配算法效率低,长度受限等缺点,在对中文编码体系和中文分词的算法进行研究的基础上,提出了一种新的词库数据结构.它支持首字Hash和标准二分查找,而且不限制词条的长度.然后介绍了基于该词库设计的一种快速的分词算法,并给出了算法的实现过程.
中文分词、二分查找、Hash、词库、搜索引擎
2
TP391(计算技术、计算机技术)
2007-07-09(万方平台首次上网日期,不代表论文的发表时间)
共2页
435-436