10.3969/j.issn.1000-0135.2006.01.004
汉语分词对中文搜索引擎检索性能的影响
针对中文网页的特点,研究了汉语分词对中文搜索引擎检索性能的影响.首先介绍中文分词在搜索引擎中的作用,然后介绍常用的分词算法.作者利用网页特征,提出一个简单的"带启发性规则的双向匹配分词策略".最后,在10G的语料库中,就各种分词算法对查全率和查准率的影响进行了实验比较,结果表明分词性能和检索性能没有正比关系.
汉语分词、信息检索、中文搜索引擎
25
G35(情报学、情报工作)
四川省教育厅资助项目2003B035
2006-04-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
21-24