10.11871/jfdc.issn.2096-742X.2020.04.008
海洋环流模式LICOM的GPU实现与优化
[目的]为了加速海洋环流模式LICOM的积分计算,降低因分辨率的提升而带来的运行成本,本文设计并实现了基于CUDA C的GPU加速版本.[方法]本文基于目前最新的LICOM3版本,在分析LICOM海洋网格块的并行算法的基础上,结合使用CUDA线程并行计算海洋网格点,将LICOM主要计算程序移植到GPU平台上,并从数据传输和设备内存的使用两个方面进行优化.[结果]实验表明,GPU版本模拟结果的与原CPU版本基本一致.与使用相同数量的Intel Xeon E5-2680 V2 CPU相比,使用2至16块NVIDIA K20 GPU单个模式天加速了9.31到1.27倍.[局限]由于LICOM3计算的边界同步通信比较多,限制了程序的可扩展性,未来需要通过边界通信优化和算法优化来提高模式的可扩展性.[结论]本文对LICOM3程序进行了GPU版本的实现和优化,取得了一定的加速效果并保持较好的扩展性,为今后面向更大规模计算的海洋环流模式发展提供了经验和参考.
GPU、CUDA、并行计算、高性能计算、LICOM、海洋环流模式
2
国家重点研发计划"地球系统模式的改进、应用开发和高性能计算";国家自然科学重点基金"涡分辨全球气候海洋模式及海洋气候效应研究";中国科学院科研信息化应用工程"高分辨率地球系统模式集成与优化";中国科学院战略性先导科技专项
2020-09-25(万方平台首次上网日期,不代表论文的发表时间)
共13页
92-104