10.3778/j.issn.1002-8331.1906-0192
改进词向量模型的用户画像研究
用户画像技术可以给企业带来巨大的商业价值.针对用户的历史查询词,利用词向量可以得到查询词在语义层次上的表达,但词向量模型对于同一个单词生成的词向量是相同的,使得该模型无法很好的处理一词多义的情况.因此,使用LDA主题模型为每个查询词分配主题,使查询词和其主题共同放入神经网络模型中学习得到其主题词向量,最后采用随机森林分类算法对用户基本属性进行分类构建用户画像.实验结果表明,该模型的分类精度要高于词向量模型.
用户画像、词向量、LDA主题模型、随机森林
56
TP391.1(计算技术、计算机技术)
国家自然科学青年基金;江西省经济犯罪侦查与防控技术协同创新中心开放基金
2020-01-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
180-184