10.3969/j.issn.1673-629X.2010.04.035
巧用黑盒法逆推百度中文分词算法
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术.笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象.介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法--正向最大匹配分词算法.该算法是最常见的一种中文分词算法,比较符合人的思维习惯.了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进.
中文分词、分词算法、搜索引擎、百度
20
TP391.41(计算技术、计算机技术)
2010-05-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
136-139