10.19678/j.issn.1000-3428.0058071
面向异构架构的传递闭包并行算法
传统求图传递闭包的方法存在计算量大与计算时间长的问题.为加快处理大数据量的传递闭包算法的计算速度,结合算法密集计算和开放式计算语言(OpenCL)框架的特征,采用本地存储器优化的并行子矩阵乘和分块的矩阵乘并行计算,提出一种基于OpenCL的传递闭包并行算法.利用本地存储器优化的并行子矩阵乘算法来优化计算步骤,提高图形处理器(GPU)的存储器利用率,降低数据获取延迟.通过分块矩阵乘并行计算算法实现大数据量的矩阵乘,提高GPU计算核心的利用率.数据结果表明,与CPU串行算法、基于开放多处理的并行算法和基于统一设备计算架构的并行算法相比,传递闭包并行算法在OpenCL架构下NVIDIA GeForce GTX 1070计算平台上分别获得了593.14倍、208.62倍和1.05倍的加速比.
矩阵乘;传递闭包;图形处理器;开放式计算语言;并行算法
47
TP311(计算技术、计算机技术)
国家自然科学基金;山东省自然科学基金;山东省重点研发计划项目
2021-08-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
131-139