10.19678/j.issn.1000-3428.0050322
基于ARM V8平台的向量算法库实现与优化
基于ARM V8架构的VecOp向量算法库,提出一种基础向量算法在ARM V8平台上实现和优化的方案.从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARM V8平台上的优化.实验结果表明,该方案在ARM V8计算平台上实现的向量算法库性能提升可达到10%~300%.
数学函数库、ARM V8架构、向量算法库、单指令流多数据、访存优化
45
TP311(计算技术、计算机技术)
国家重点研发计划2017YFB0202105,2016YFB0200803,2017YFB0202302;国家自然科学基金重点项目61272136;北京市教委科研计划KM201811417006
2019-07-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
82-88