10.13229/j.cnki.jdxbgxb201505026
Bellman-Ford算法性能可移植的GPU并行优化
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题.实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍.
计算机软件、Bellman-Ford算法、GPU并行编程及优化技术、并行归约算法、性能可移植性
45
TP302(计算技术、计算机技术)
吉林省重大科技攻关项目20130206052GX;“863”国家高技术研究发展计划项目2012AA010902;“973”国家重点基础研究计划项目2011CB302500
2016-05-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
1559-1564