10.3969/j.issn.1001-5965.2001.01.022
优化的BLAS对并行程序性能的影响
利用SMP结构的多处理器结点通过高速网络构造高性能并行计算系统是当前的一种发展趋势.为了使BLAS在SMP结点上具有更高的效率,本文讨论了BLAS3的多线程化问题;同时以SUMMA作为并行计算的实例,说明提高结点机程序的性能对并行计算性能的影响.试验结果显示,在一定的条件下,多线程BLAS3在SMP平台上可以获得超线性加速比;结点计算性能的提高的同时必须提高网络有效带宽,才能充分发挥并行计算的效能.
并行处理、线性代数、最佳化、多线程、BLAS、SUMMA
27
TP311.11(计算技术、计算机技术)
国家高技术研究发展计划(863计划)863-306-ZD-03
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
79-82