10.13266/j.issn.0252-3116.2022.04.013
搜索引擎全量数据的用户画像模型研究——设计与实证
[目的 /意义]基于某搜索引擎5亿全量数据,本文设计研究年轻用户大数据画像分析的总体模型和详细的研究流程,以建立用户画像的基本方法论.[方法/过程]借助数据分析与数据验证过程的结合,通过KL散度和AIO社会学模型选取有代表性的计算样本和标签样本,并利用CH-Score和SH-Score明确算法与相关参数,利用聚类算法,通过TGI解读集群数据结果,最终利用关联规则发现年轻用户的汽车需求.[结果/结论]研究将年轻用户18-24岁代际分为5类,25-34岁分为4类,以这共计9类群体验证模型和流程的有效性,最终完成大数据用户画像从0到1的方法论的建立,并在其中融合调研方法与大数据方法.
大数据;用户画像;研究模型
66
G202(信息与传播理论)
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共13页
129-141