10.3969/j.issn.1001-3695.2018.09.004
一种基于剪切的SLP向量化方法
作为多媒体和科学计算等领域重要的程序加速器件之一,SIMD扩展部件现已广泛集成于各类处理器中.自动向量化方法是目前生成SIMD向量化程序的重要手段.超字并行SLP (superword level parallelism)方法现已广泛应用于编译器中,并成为实现基本块级代码向量化的主要手段.SLP在进行收益评估时仅考虑代码段整体向量化的收益,并没有考虑到向量化收益为负的片段会降低最终整体的向量化收益,从而导致SLP方法无法达到最好的向量化效果.基于此,提出了一种基于剪切的SLP向量化方法(throttling SLP,TSLP).通过寻找最优的向量化子图,去除了向量化收益为负的代码段,从而可以获得更好的向量化效果.通过标准测试程序的实验结果表明,与原来的SLP方法相比,TSLP方法平均能够获得9%的性能提升.
单指令多数据扩展部件、自动向量化、超字并行、代价模型
35
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目61472447;国家“863”计划资助项目2014AA01A300;国家“核高基”重大专项资助项目2013ZX0102-8001-001-001
2018-12-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
2578-2582