10.3321/j.issn:1002-8331.2005.15.001
数据融合优化在IA-64机器上的性能可移植性测试和分析
文章[1]中提出了数组之间的数据融合优化方法,并以IA-32服务器为平台测试了数据融合优化的效果.测试结果表明,在IA-32机器上,数据融合优化在性能代价模型的控制下,能较好地改善具有非连续数据访问特征的应用程序的CACHE利用率.那么,在新一代体系结构IA-64平台上,数据融合优化的效果如何呢?该文分别以Intel IA-32服务器和HP ITANIUM服务器为平台,用Intel FORTRAN编译器ifc和efc及自由软件编译器g95分别编译并运行数据融合优化变换前后的程序,获得两种平台上的执行时间及相关的性能数据.测试结果表明,源程序级的数据融合优化不能很好地与IA-64平台上的EFC编译器高级优化配合工作,在03级优化开关控制下,优化效果是负值.此测试结果进一步表明,编译高级优化如数据预取、循环变换和数据变换等各种优化必须结合体系结构的特点统筹考虑,才能取得好的全局优化效果.该文为研究各种面向IA-32体系结构的编译优化算法在IA-64体系结构上的性能可移植性优化起到抛砖引玉的作用.
数据融合、局部性、循环变换、数据预取、IA-32 IA-64
41
TP31(计算技术、计算机技术)
国家高技术研究发展计划863计划2002AA1Z2101,2004AA1Z2210
2005-06-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
1-4,16