10.3778/j.issn.1673-9418.1512078
天体物理成团研究中的非规则访存优化
HGGF(halo-based galaxy group finder)算法实现了基于暗物质晕的星系找群,在研究宇宙大尺度结构及宇宙的演化等领域中占有至关重要的地位.但由于数据规模的增长,急需对HGGF算法进行优化,以缩短运行时间.经分析,算法的热点部分耗时受到非规则访存的严重影响,因此针对算法的结构和非规则访存模型,提出了数据预排序方法,并分析了该方法如何影响访存过程.在此基础上,利用数据对齐、循环分解进一步优化访存效率,利用负载均衡和互斥变量私有化的方法提高了OpenMP的并行效率,最终将HGGF应用使用12线程加速11.6倍,同时取得了更好的可扩展性.主要有三点贡献:(1)分析了HGGF算法的非规则访存问题;(2)提出并分析了数据预排序方法;(3)使用数据对齐、循环分解、负载均衡、互斥变量私有化方法提高了HGGF应用的并行性能.
天体物理成团、非规则访存优化、数据预排序、并行计算
11
TP391(计算技术、计算机技术)
The National High Technology Research and Development Program of China under Grant No.2014AA01A302国家高技术研究发展计划863计划;the Project of Japan Society for the Promotion of Science RONPAKU Fellowship
2017-05-03(万方平台首次上网日期,不代表论文的发表时间)
共11页
80-90