10.16208/j.issn1000-7024.2015.01.030
面向异构多核处理器的的循环分块
将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速.针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的“源-源”自动并行化系统Auto-ACC中进行实现.测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速.
异构多核处理器、循环分块、数据重用、OpenACC、自动并行化
36
TP314(计算技术、计算机技术)
“核高基”国家科技重大专项基金项目2009ZX01036-001-001-2;数学工程与先进计算国家重点实验室开放课题基金项目2013A11
2015-03-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
168-173