10.19678/j.issn.1000-3428.0056332
Q-learning算法优化的SVDPP推荐算法
为进一步改善个性化推荐系统的推荐效果,通过使用强化学习方法对SVDPP算法进行优化,提出一种新的协同过滤推荐算法.考虑用户评分的时间效应,将推荐问题转化为马尔科夫决策过程.在此基础上,利用Q-learning算法构建融合时间戳信息的用户评分优化模型,同时通过预测评分取整填充和优化边界补全方法预测缺失值,以解决数据稀疏性问题.实验结果显示,该算法的均方根误差较SVDPP算法降低了0.0056,表明融合时间戳并采用强化学习方法进行推荐性能优化是可行的.
协同过滤、奇异值分解、强化学习、马尔科夫决策过程、Q-learning算法
47
TP18(自动化基础理论)
山西省重点研发计划社会发展领域;山西省自然科学基金;山西省科技重大专项
2021-02-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
46-51