一类非张量积区域快速傅立叶变换算法在国产并行机上的可扩展性测试
本文给出了一类基于六边形非张量积区域上的广义离散快速傅立叶变换算法(HFFT)以及它在国产百万亿次超级计算机(曙光5000A)上的测试运行情况.文章介绍了该算法在曙光5000A上的大规模集群测试加速比和可扩展性特性,并通过分析,说明HFFT在国产超级计算机的大规模并行环境下拥有良好的可扩展性.在使用8192个处理器核的情况下,HFFT加速比达到了277倍.我们同样对FFTW软件包进行了测试.本文的分析为解决其他科学计算程序在国产百万亿次规模集群上的可扩展性问题,提供了一些先行的参考和建议.
非张量积区域、快速傅立叶变换、曙光5000A、可扩展性测试
31
TP3;TP1
本文工作受到国家自然科学基金60303020;国家自然基金重点项目60533020;国家863项目No.2006AA01A125,No.2009AA01A134,No.2009AA01A129的部分资助
2010-07-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
123-130