10.3969/j.issn.1000-3428.2016.09.001
SIMD非对齐访存结构设计与实现
单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降.为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cache非对齐访存结构.实验结果表明,在双体cache非对齐访存结构下,通过两数组相加与SIMD向量化实现的非对齐访存代码可达到对齐访存代码性能的99%,提高了SIMD向量化的访存效率.
高性能计算、数据级并行、向量化、单指令流多数据流扩展、非对齐访存、Gem5模拟器
42
TP302.2(计算技术、计算机技术)
国家自然科学基金资助项目“面向超高性能计算的众线程宽向量微体系结构研究”61170045
2016-11-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
1-4