10.19363/J.cnki.cn10-1380/tn.2021.09.08
大规模图推荐模型的快速优化机制
推荐系统在帮助用户从海量数据中发现自己感兴趣的信息时能起到重要作用.近些年来,深度学习在计算机视觉等诸多领域卓有成效,吸引了越来越多推荐系统领域学者的关注.推荐系统结合图神经网络等深度学习方法取得了令人瞩目的效果.然而,现存的许多方法主要关注在如何用深度学习模型来设计推荐系统的架构,却少有工作关注推荐系统的优化框架,尤其是从优化框架方面提升推荐系统的训练效率.因此随着模型的日益复杂,训练模型的时间代价也越来越大.本工作中,我们试图从优化框架方面提升大规模图推荐模型的训练效率.推荐系统中最主流的模型优化框架为贝叶斯个性化排序(Bayesian personalized ranking,BPR),其潜在假设是目标用户对于已交互的物品的喜好程度强于未交互的物品,然后通过最大化用户对感兴趣物品和不感兴趣物品的评分差来实现.然而,BPR优化器的瓶颈在于模型参数的学习效率低下,在计算资源有限,且用户的兴趣要具有时效性等现实因素下,极大限制了主流图推荐模型在工业场景中的应用.究其原因,BPR优化器需要每个训练样本对单独经过非线性激活函数,这样元素级别的运算无法转化为矩阵操作等并行计算的形式,进而未能发挥GPU的并行加速性能.受平方误差损失函数在结合推荐任务时,对矩阵化操作较为友好的启发,我们设计了一种快速非采样优化器FGL,可广泛适用于主流图推荐模型.经过一系列理论推导与转换,FGL有效规避了损失函数中复杂度较高的计算项,极大提升了模型的训练效率.以经典矩阵分解模型和最先进的图神经网络模型LightGCN为代表,本文在四个基准数据集上进行了大量的实验.实验结果表明,FGL优化器在保证推荐准确度下,其训练效率相比于BPR获得了数量级层面的加速,表明FGL在现实工业场景中具有很大的应用潜力.
推荐系统;图神经网络;优化框架;训练效率
6
TP183(自动化基础理论)
本课题得到国家自然科学基金No.U19A2079.No.61972372
2021-11-05(万方平台首次上网日期,不代表论文的发表时间)
共11页
99-109