10.16452/j.cnki.sdkjzk.2019.03.007
Silicon-Crystal应用的神威OpenACC移植与数据流驱动任务图并行化
利用神威OpenACC在“太湖之光”上成功移植了Silicon-Crystal应用,针对控制流驱动的OpenACC无法有效解决访存密集型应用带宽访存优化和跨时间迭代问题,通过数据流驱动的任务图并行化方法挖掘任务迭代间的并行性,利用任务间的错峰访存提高访存带宽.实验结果表明,神威OpenACC移植单核组获得2.26倍加速;时间步长为1时,任务图并行化移植后的该应用可获得2.52倍加速,性能较OpenACC提升11.5%;时间步长扩展至20时,任务图规模随之增加,任务的乱序调度使错峰访存的优势进一步扩大,整体应用达到3.2倍性能加速,性能较OpenACC提升42%.
太湖之光、神威OpenACC、数据流、任务图并行、MD模拟
38
TP311.52(计算技术、计算机技术)
国家重点研发计划项目子课题2017YFB0202002
2019-06-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
57-64