Q-learning算法优化的SVDPP推荐算法

引用

摘要：

为进一步改善个性化推荐系统的推荐效果,通过使用强化学习方法对SVDPP算法进行优化,提出一种新的协同过滤推荐算法.考虑用户评分的时间效应,将推荐问题转化为马尔科夫决策过程.在此基础上,利用Q-learning算法构建融合时间戳信息的用户评分优化模型,同时通过预测评分取整填充和优化边界补全方法预测缺失值,以解决数据稀疏性问题.实验结果显示,该算法的均方根误差较SVDPP算法降低了0.0056,表明融合时间戳并采用强化学习方法进行推荐性能优化是可行的.

关键词：协同过滤、奇异值分解、强化学习、马尔科夫决策过程、Q-learning算法

所属期刊栏目：47

分类号：TP18(自动化基础理论)

资助基金：山西省重点研发计划社会发展领域;山西省自然科学基金;山西省科技重大专项

在线出版日期：2021-02-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：46-51

英文信息展示

期刊专题