10.11925/infotech.2096-3467.2018.0414
基于XGBoost算法的用户评分预测模型及应用
[目的]基于用户网络评论构建有效的评分预测模型,挖掘用户消费行为特征.[方法]基于LDA模型,量化用户评论为主题特征向量作为解释变量,将用户评分作为被解释变量,采用XGBoost算法,并加入样本扰动和属性扰动生成多个模型进行集成,构建用户评分预测模型.[结果]针对某汽车门户网站的用户评论评分预测结果表明,该模型较好地揭示了用户对汽车商品的偏好.较逻辑回归、随机森林算法,其预测准确度分别高出13.73%、0.64%,且具有较高的计算效率.[局限]未融合其他方面的数据对用户行为特征进行更全面的刻画.[结论]将用户评论量化为主题特征向量,基于XGBoost算法能够准确、高效地预测用户评分.
评分预测、XGBoost算法、LDA主题模型、文本特征提取、用户评论
3
G35(情报学、情报工作)
国家自然科学基金面上项目“劣者淘汰两阶段自适应临床试验的设计和分析”11471239;国家社会科学基金青年项目“社交媒体中敏感信息可信度评估方法研究”18CTJ008;全国统计科研计划重点项目“Web社会网络中敏感信息识别及突发事件预测研究”项目2017LZ05的研究成果之一
2019-04-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
118-126