10.16112/j.cnki.53-1223/n.2024.04.231
基于Double DQN的用户群体满意度最大化在线服务信誉度量
传统的信誉度量无法实时反映动态环境中服务质量和用户需求的变化.在线服务信誉度量机制依赖于用户反馈评分且服务于用户,用户满意度会受该机制的影响.未考虑用户群体满意度最大化的信誉度量机制难以吸引用户群体.此外,用户评价标准的不一致性会使不同用户的评分难以直接比较,从而导致信誉度量结果不客观.为此,作者提出了一种基于Double DQN的用户群体满意度最大化在线服务信誉度量方法.首先,针对用户评价标准不一致的情况,借助Kendall tau距离定义用户群体满意度;其次,将动态环境下的在线服务信誉度量问题通过马尔可夫决策过程建模为一个寻找最大化用户群体满意度的优化问题;最后,采用Double DQN算法求解该优化问题.通过在Movielens数据集上进行实验验证了该方法的有效性.实验结果表明该方法能够给出最优信誉决策策略,从而最大化用户群体满意度.
在线服务、信誉度量、用户偏好、Kendall tau距离、深度强化学习
49
O255;TP18
国家自然科学基金;云南省新型研发机构培育对象孵化服务平台建设一期项目
2024-09-03(万方平台首次上网日期,不代表论文的发表时间)
共13页
105-117