10.3969/j.issn.1000-3428.2012.22.070
基于Lucene的中文分析器分词性能比较研究
针对Lucene自带的中文分析器分词性能不理想并且难以选择第三方分析器的问题,研究多种基于Lucene的中文分析器,对语句分词、分词速度、建立索引的空间与时间、检索结果以及检索速度等方面进行比较.分析结果表明,在Lucene框架下,基于词典分词的Paoding分析器总体性能最优,Lucene自带的一元分析器分词速度最快,imdict与ICTCLAS4J分析器在算法效率上存在一定改进空间.
Lucene框架、搜索引擎、中文分词、分析器、分词速度、索引、检索
38
TP391(计算技术、计算机技术)
航空科学基金资助项目20085568013
2013-01-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
279-282