10.11896/j.issn.1002-137X.2017.010.013
多核/众核平台上推荐算法的实现与性能评估
用OpenCL语言标准设计并实现了推荐系统领域的两种经典算法:交替最小二乘法(Alternating Least Squares,ALS)与循环坐标下降法(Cyclic Coordinate Descent,CCD).将其应用到CPU,GPU,MIC多核与众核平台上,探索了在该平台上影响算法性能的因子:潜在特征维数与线程个数.同时,将OpenCL实现的两种算法与CUDA和OpenMP的实现进行比较,得出了一系列结论.在同等条件下,与ALS算法相比,CCD算法的精度更高,收敛速度更快且更稳定,但所耗时间更长.ALS和CCD算法基于OpenCL的实现性能不亚于CUDA(CCD上加速比为1.03x,ALS上加速比为1.2x)和OpenMP的实现(CCD与ALS上加速比大约为1.6~1.7x),并且两种算法在CPU平台上的性能均比GPU与MIC好.
推荐系统、OpenCL、ALS、CCD
44
TP311(计算技术、计算机技术)
国家自然科学基金项目61170049,61402488,61502514,61602501;国家863项目2015AA01A301
2017-11-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-74