一种利用并行复算实现的OpenMP容错机制
基于并行复算的故障恢复技术,将故障恢复的计算任务分配至未发生故障的结点上并行执行,从而显著缩短复算时间,有效降低故障恢复开销,提高并行程序容错性能.基于该故障恢复技术,提出了一种针对OpenMP并行程序的容错机制PR-OMP,有效解决了分段复算、复算负载重分布等问题;此外,还扩展了传统编译数据流分析技术,提出了针对OpenMP并行程序的数据流分析技术,并基于该技术计算状态保存开销进行优化.设计实现了用于支持PR-OMP的编译工具GiFT-OMP,并通过实验证明了PR-OMP机制及其支持工具的有效性,评估并分析了其性能和可扩展性.
容错、OpenMP、并行复算、数据流分析
23
TP316(计算技术、计算机技术)
国家自然科学基金60921062,61003087;国家高技术研究发展计划8632009AA012102
2012-05-14(万方平台首次上网日期,不代表论文的发表时间)
共17页
411-427