10.3969/j.issn.1007-130X.2022.10.002
非结构有限体积CFD计算的网格重排序优化
网格重排序是提升流体力学CPU和GPU并行计算效率的重要手段之一.对于非结构网格,由于其数据存储无规律,数据的间接访问会导致访存延迟,尤其是在GPU并行计算时,数据的间接访问将引起内存的非对齐访问,放大了访存延迟的影响.对此,采用Reverse Cuthill-Mckee网格重排序方法优化了非结构网格的数据局部性,并设计了一种面向编号重排序方法.算例测试表明,网格重排序不影响最终计算结果.对比分析了网格重排序对非结构求解器在CPU和GPU上的性能影响:对CPU计算,可以使部分热点函数运行时间降低约20%,整体运行时间降低15%~20%;对GPU计算,大部分热点函数运行时间可降低35%~60%,程序整体运行时间降低约40%.
非结构网格、网格重排序、GPU并行计算、计算流体力学、风雷软件
44
TP319(计算技术、计算机技术)
国家数值风洞工程项目;广东省引进创新创业团队项目
2022-11-07(万方平台首次上网日期,不代表论文的发表时间)
共9页
1721-1729