10.3969/j.issn.1000-3428.2014.05.009
基于CUDA的热传导GPU并行算法研究
在热传导算法中,使用传统的CPU串行算法或MPI并行算法处理大批量粒子时,存在执行效率低、处理时间长的问题。而图形处理单元(GPU)具有大数据量并行运算的优势,为此,在统一计算设备架构(CUDA)并行编程环境下,采用CPU和GPU协同合作的模式,提出并实现一个基于CUDA的热传导GPU并行算法。根据GPU硬件配置设定Block和Grid的大小,将粒子划分为若干个block,粒子输入到GPU显卡中并行计算,每一个线程执行一个粒子计算,并将结果传回CPU主存,由CPU计算出每个粒子的平均热流。实验结果表明,与CPU串行算法在时间效率方面进行对比,该算法在粒子数到达16000时,加速比提高近900倍,并且加速比随着粒子数的增加而加速提高。
热传导算法、图形处理单元、统一计算设备架构、并行计算、时间效率、加速比
TP399(计算技术、计算机技术)
国家自然科学基金资助项目61073064。
2014-06-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
41-44,48