10.3969/j.issn.1673-629X.2020.12.024
基于混合特征的电影评分预测系统
电影评分是衡量一部电影优劣的重要标准,对于投资商和观影者极具参考价值,因此电影评分的预测成为电影领域的研究热点.然而目前的评分预测系统由于特征信息不足,特征工程处理方法过于简单,机器学习算法较为单一,所以预测误差偏大.针对这一问题,结合自然语言处理技术提出一种基于混合特征的预测模型,并应用到电影评分预测系统中.数据集来源是某常用电影网站,同时为了获取更好的训练数据,需要对电影特征信息进行复杂的特征工程处理.利用训练完成的Bert模型矢量化电影数据集中的文本信息得到文本矢量特征,并采用支持向量机(SVM)算法初步训练预测评分.将该评分作为一维新特征和电影特征信息一起通过随机森林(random forest)算法训练预测最终评分.实验结果表明,该预测模型是可行的,预测值与真实值的误差较小,准确性显著提升.
电影评分预测、机器学习、自然语言处理、文本矢量特征、Bert
30
TP181(自动化基础理论)
国家自然科学基金项目;上海市自然科学基金项目
2021-02-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
136-141