10.3969/j.issn.1007-130X.2013.11.027
基于硬件事件的并行程序指令级性能模型与应用
当前,应用程序持续运行性能与高性能计算机峰值性能的差距有扩大的趋势,许多实际应用程序的性能通常只能达到机器峰值性能的5%~10%,甚至更低,如何优化并行应用成为高性能计算领域关注的焦点.从如何利用硬件事件进行程序指令级优化入手,提出一种基于硬件事件的性能模型,揭示出程序性能与程序特征、微处理器特征的关系.基于该性能模型,在Intel Xeon微处理器平台上对Euler等程序进行优化,gas1dapproxy等性能热点模块的执行时间可以缩短12%~61%.性能优化实验表明:使用该性能模型可以降低用户进行指令级并行性能优化的难度,指导用户选择正确的性能优化方向.
性能分析、性能优化、性能模型、指令级并行
35
TP302;TP38(计算技术、计算机技术)
国家863计划资助项目2012AA01A309
2013-12-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
175-181