高性能计算机的可靠性技术现状与趋势
随着高性能计算机系统性能的不断提升和硬件规模的不断扩大,如何实现系统的可靠运行,是高性能计算机尤其是P级计算机研制中面临的重要技术挑战.从高性能计算机对可靠性技术的需求出发,全面介绍了高性能计算机硬件设计中的可靠性技术现状,包括避错、静态冗余、动态冗余和在线替换等技术,详细分析了各种可靠性技术在典型机器中的应用情况;最后对高性能计算机可靠性技术的发展趋势进行了深入探讨,包括多核处理器的可靠性设计、全方位的内存防护技术和刀片式的冗余架构.
高性能计算机、可靠性、避错、容错、冗余、在线替换
47
TP302.7(计算技术、计算机技术)
2010-06-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
589-594