一种融入用户点击模型Word2Vec查询词聚类
用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CT-Word2Vec神经网络语言模型.CT-Word2Vec模型不仅利用词汇的上下文信息将词转化成向量,而且还将用户的搜索点击行为融入词向量的学习过程当中.聚类实验结果表明,基于Word2Vec的词向量的查询词表示方法相对于传统的词袋法在熵、纯度衡量指标上有20%到30%的提高.基于CT-Word2Vec的词向量表示方法与Word2Vec相比有2%到4%的提升.
查询词、聚类、Word2Vec、点击模型、CT-Word2Vec
37
TP311(计算技术、计算机技术)
国家科技支撑项目2012BAH93F03;上海市科委项目14511107000
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
676-681