10.3969/j.issn.1000-3428.2017.01.011
基于申威26010处理器的扩展函数库实现与优化
Intel,AMD和IBM都具有针对自身特点的向量扩展库.相比于传统的标量计算,向量化技术带来的加速比较高.为此,针对申威26010处理器开发向量数学库软件.在分析函数常用级数法和迭代法算法的基础上,结合三角函数、反三角函数、指数函数和对数函数研究一种高效向量化算法,并对其进行实现与优化,使其支持函数高精度和高性能计算,并且满足浮点运算的要求.测试结果表明,该算法精度达到申威26010处理器上特定应用的要求,与Intel VML数学库相比,各函数的平均加速比均达到1.1以上.
浮点运算、数学函数、申威26010处理器、数据分段、指令调度
43
TP311(计算技术、计算机技术)
国家“863”计划项目2009AA012201
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
61-66,71