10.3969/j.issn.1673-629X.2022.08.004
基于Multi-Aspect的融合网络用户画像生成方法
在大数据时代,用户画像对于企业了解并获取目标用户的重要性日益提升,但基于统计的用户画像方法无法处理非结构化的文本数据,而传统的基于模型的用户画像方法亦无法从多角度深层次提取用户特征.为实现更加全面且精准的用户属性预测,该文提出一种基于多层级特征提取的融合网络用户画像生成方法,通过对用户原始文本关键词的提取和排序,分别生成基于top 2关键词的子句表示和top N关键词的词向量,并结合循环神经网络和注意力机制,构建多层次用户特征提取的分类模型,利用原始用户数据进行用户属性预测.在搜狗用户搜索文本数据集上的实验表明,文中模型较其他基线模型在分类准确率上显著提升,达到0.73,通过消融实验进一步表明各个模块均为有效提取用户特征从而提升分类准确率发挥了重要作用.
用户画像、多层级特征提取、关键词抽取、循环神经网络、注意力机制
32
TP391(计算技术、计算机技术)
北京市自然科学基金4212013
2022-08-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
20-25