10.11772/j.issn.1001-9081.2017.01.0103
分层检查点的近似最优周期计算模型
针对大规模高性能计算(HPC)系统中检查点效率提升问题,提出一种面向分层检查点近似最优周期计算模型.首先,通过分析一个HPC系统中应用程序的执行过程,将检查点周期优化抽象为一个非线性的检查点成本模型;其次,通过分析可能故障位置推导出分层检查点成本公式,并引入两个减速因子和一个加速因子来模拟消息日志对分层检查点造成的影响.仿真实验结果表明,所提模型与理论近似最优周期检查点成本平均误差在5%以下,相对传统检查点周期优化模型的平均误差降低了20%,能够有效提高检查点的效率,提升HPC系统可用性.
高性能计算、容错、分层检查点、检查点周期、近似最优解
37
TP399;TP302(计算技术、计算机技术)
National Natural Science Foundation of China61370212,61402127,61502118;the Natural Science Foundation of Heilongjiang Province F2015029.国家自然科学基金资助项目61370212,61402127,61502118;黑龙江省自然科学基金资助项目F2015029
2017-02-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
103-107