10.13705/j.issn.1671-6841.2018319
基于Web日志的性格预测与群体画像方法研究
提出一种用户性格预测与群体画像方法.该方法将数据挖掘、机器学习和画像技术相结合,首先改进了传统TF-IDF算法没有考虑文章结构的问题,提高网页主题挖掘的准确率;其次根据大五类性格构建"性格-主题-关键词"(PTK)模型,归结不同用户的兴趣属性特征和性格属性特征,并结合用户的基础属性对用户进行综合画像;然后运用K-means方法将拥有相同属性特征的人群进行聚类,描绘在社会中拥有相似特征人群的群体面貌;最后通过实验证明,该方法使用改进的TF-IDF方法对网页文本进行挖掘效果要优于LDA主题模型,而且可以有效对用户的性格进行预测与群体画像.
Web日志、数据挖掘、用户画像、性格预测、TF-IDF、K-means
52
TP391(计算技术、计算机技术)
北京信息科技大学科研水平提高项目;国家自然科学基金项目
2020-03-23(万方平台首次上网日期,不代表论文的发表时间)
共8页
39-46