10.3969/j.issn.1003-3513.2009.04.010
搜索引擎查询日志的词性标注和挖掘研究
利用搜狗(Sogou)2007年3月的查询日志,使用词性标注方法,得出高频词性标注结果的分布特征.发现用户在查询中以使用名词为主,动词为辅,鲜有其它词类出现在高频词性标注结果中.以"的"为代表的虚词较少地出现在高频词性标注结果中.网络搜索的查询式与自然语言在句法上存在一定差异,但也有相通之处.用户主要使用名词进行概念性检索,关键词仍为用户进行检索的主要手段.高频词性标注结果部分符合Zipf定律.
日志挖掘、词性标注、语言行为、词性分布、查询句法
G352(情报学、情报工作)
2009-06-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
50-56