10.11871/jfdc.issn.2096-742X.2024.04.016
GROMACS在鲲鹏920平台的性能分析及运行优化
[应用背景]ARM众核架构处理器以其高性能、高并行性及低功耗的特点,在分子动力学、流体及天气模拟等领域扮演着越来越重要的作用.[局限]然而,分子动力学模拟软件运行时不同维度的任务分解策略(如粒子作用、时空域分解等)、多样化的并行策略导致负载特征多样而与众核处理器基于高度并行的计算资源所产生的算力这一特点难以很好地匹配,进而导致各计算单元运行时效率低的问题已成为了限制运行时性能提升的重要瓶颈之一.[方法]针对这一问题,以华为技术有限公司自主研发ARM架构鲲鹏920处理器和GROMACS软件为研究对象,通过对鲲鹏920处理器结构特点和算力特征、GROMACS软件任务分解、并行执行过程进行深入分析,提出运行时并行参数优化策略,以更好地适配软件的算力需求和硬件的算力特点,提升了软件计算性能.[结果]通过系统分析性能瓶颈并实践优化策略,相比优化前取得了16.9%的加速效果.[结论]此研究成果可为分子动力学模拟在众核计算环境下的性能优化、国产高性能计算系统及分子动力学模拟专用机等的研发提供一定的参考依据.
分子动力学、GROMACS、鲲鹏920、性能优化
6
TP391;TK227.1;TM621
国家重点研发计划;国家自然科学基金
2024-08-25(万方平台首次上网日期,不代表论文的发表时间)
共12页
182-193