10.3969/j.issn.1673-808X.2022.03.012
基于晶格Boltzmann方法的CUDA加速优化
为提高流体的计算效率并保证结果的准确性,利用CUDA编程平台和GPU强大的浮点计算能力,实现了基于晶格玻尔兹曼方法的泊松流模拟计算加速.设计了线性寻址和下标寻址2种不同寻址方式,将这2种寻址方式分别应用到晶格玻尔兹曼程序的格点碰撞、迁徙流动、宏观量计算等步骤中,并探讨2种寻址方式对程序计算效率带来的影响.同时在程序中使用统一内存管理,通过这样的方式开辟内存的变量可在主机端和设备端同时使用,简化了代码复杂度,同时降低了频繁为变量开辟内存带来的消耗.使用Intel?Xeon?E-52620 v4 CPU,Nvidia Quadro GP100 GPU进行计算,在线性寻址方法和下标寻址方法中分别获得了71倍和25倍CPU串行代码的加速比.
CUDA、晶格玻尔兹曼方法、平面泊松流、线性寻址、下标寻址
42
O414.2(理论物理学)
国家自然科学基金11362005
2022-11-02(万方平台首次上网日期,不代表论文的发表时间)
共5页
240-244