10.3969/j.issn.1000-7024.2007.07.071
多次Hash快速分词算法
中文分词是中文信息处理的一个重要的组成部分.一些应用不仅要求有较高的准确率,速度也是至关重要的.通过对已有分词算法的分析,尤其是对快速分词算法的分析,提出了一种新的词典结构,并根据新的词典结构提出新的分词算法.该算法不仅实现对词首字的Hash查找,也实现了词的其它字的Hash查找.理论分析和实验结果表明,该算法在速度上优于现有的其它分词算法.
中文分词、中文信息处理、哈希、数据结构、时间复杂度
28
TP391.1(计算技术、计算机技术)
2007-05-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
1716-1718