10.3969/j.issn.1673-629X.2013.07.038
一种基于OPENACC的GPU加速实现高斯模糊算法
针对使用底层API进行GPU加速时存在的编码复杂以及效率低下等缺陷,文中试图利用基于中间层的OPENACC加速技术对传统的串行代码进行改写,从而达到改善开发效率,简化代码之目的.文中以传统的串行高斯模糊算法为处理对象,在其中添加OPENACC指令,提出基于OPENACC指令的GPU加速算法,并对算法流程进行了分析和说明.通过与原生CUDA和串行高斯的结果对比之后,发现随着处理像素数量的增加,串行高斯性能呈指数变化,而CUDA和OPENAC则呈线性变化.结果表明,该算法能在不改变原有非并行代码结构的基础上,通过增加高效的OPENACC指令即可获得与CUDA近似的图像处理质量和处理性能,且较CUDA具有更高的代码开发效率.
OPENACC、图形处理器、统一计算架构、高斯模糊
23
TP311(计算技术、计算机技术)
广东省自然科学基金S2011010002537;广东省科技计划项目2012A030400029
2013-10-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
147-150