10.3969/j.issn.1627-9730.2008.05.040
一种高可靠、高可用集群计算平台的设计与实现
高可靠与高可用已经成为高性能计算中不可或缺的要素.文章设计并实现的H3C集群系统应用对称式热备份(Symmetry Active/Active Replication)机制提高了集群关键服务的可靠性和可用性,使集群头节点(Head Node)在失效时仍能够提供不间断的服务.在结合LAM/MPI和BLCR检查点机制的基础上开发出高可用MPI运行环境HA/MPI,有效解决了并行计算过程中计算节点(Computing Node)失效的容错难题.
高可靠、高可用、对称式热备份、虚拟同步、LAM、检查点/恢复、进程迁移
28
TP302.7(计算技术、计算机技术)
"十一五"国防预研项目513160201
2008-07-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
143-146