10.3969/j.issn.1009-3044.2011.04.042
基于MPI并行程序的容错系统设计
为了确保并行程序能够在并行环境下准确地运行,须提高系统的可靠性,将容错技术应用到并行计算中.该文针对MPI并行程序提出一种容错系统的设计方法,采用检查点/卷回恢复技术、并添加故障检测功能,能够有效地处理节点失效故障和进程失效故障,在一定范围内实现容错,为MPI环境下进行大规模计算提供一个可使用的应用模型.
MPI并行程序、容错、检查点/卷回恢复、故障检测
7
TP302(计算技术、计算机技术)
2011-06-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
817-819