10.19678/j.issn.1000-3428.0065450
VTFTR:高维胖树中的无死锁容错路由算法
随着近年来高性能计算系统规模的急剧扩大,高性能互连网络的可靠性成为愈发重要的问题.高维胖树是一种结合了胖树与多维环网优点的网络拓扑结构,凭借其良好的可扩展性与网络性能在E级时代具有广阔的应用前景.然而,目前关于高维胖树中容错路由算法的相关研究较为有限,其可靠性问题亟待解决.为提高高维胖树拓扑在高性能互连网络中的容错能力,进一步提高对应超算系统的运行效率,提出一种用于高维胖树中叶交换机故障的容错路由算法VTFTR.该算法结合转向模型与虚通道切换的思想,通过严格控制报文在无故障路径与容错路径中的转向,使用少量的容错虚通道与额外跳步实现高维胖树中的无死锁容错.实验结果表明,在单点故障情况下,VTFTR算法的容错路径较对比算法有2~4个跳步的减少,在4096个节点规模的网络中,当叶交换机故障数量为10时,在故障叶交换机不同的分布情况下,该算法能够以1.4%~2.0%的吞吐率下降作为代价来保持全网无故障节点之间的互连.
高性能互连网络、高维胖树、容错路由算法、高性能计算、死锁预防
48
TP391(计算技术、计算机技术)
国家重点研发计划2021YFB0301000
2022-12-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
38-44,53