一种面向规则DOACROSS循环的自动并行化框架
针对现有编译器对DOACROSS循环采取保守处理而造成程序并行性巨大损失的问题,本文提出了一种面向规则DOACROSS循环的自动并行框架.首先基于依赖测试提出了同步距离求解算法以确定嵌套循环的并行层、迭代分组层,以及同步语句插入点;其次提出了明确的同步控制机制来实现不同线程间的通信;最后,本文设计了一种基于程序执行开销的流水粒度求解算法,以达到降低程序并行过程中的同步开销目的.本文将该方法在SW-VEC自动并行化系统中实现并加以验证,实验结果表明本文所提方法对FDR波前计算循环和NPB3.3.1中的LU课题有明显性能提升.
DOACROSS循环、流水并行、同步距离、同步控制机制、流水粒度
37
TP301(计算技术、计算机技术)
核高基国家科技重大专项项目2009ZX01036
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
1365-1370