10.3969/j.issn.1007-130X.2014.12.005
面向FT1000微处理器的STREAM并行计算与优化
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作.基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序.基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式.数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%~64.2%.优化后,并行程序的最高访存性能达到8.5 GB/s,对比优化前的最高访存性能最大提高了22.7%.
多线程微处理器、STREAM测试程序、性能优化
36
TP301.6(计算技术、计算机技术)
国家863计划资助项目2012AA01A301;国家自然科学基金资助项目60970033,91430218
2015-01-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
2267-2271