基于哈希算法的中文分词算法的改进
中文分词是中文信息处理一个重要的部分,一些应用不仅要准确率,速度也很重要,通过对已有算法的分析,特别是对快速分词算法的分析,提出一种新的词典结构,并根据新的词典给出新的分词算法,该算法不仅对词首字实现了哈希查找,对词余下的字也实现哈希查找.理论分析和实验结果表明,算法在速度和效率比现有的几种分词算法上有所提高.
中文分词、中文信息处理、数据结构、哈希
52
TP393(计算技术、计算机技术)
2008-07-30(万方平台首次上网日期,不代表论文的发表时间)
共3页
60-62