10.3969/j.issn.1003-5060.2023.01.009
基于重计算的深度学习加速器容错设计
2D计算阵列由于高并行性且通信简单,在深度学习加速器(deep learning accelerator,DLA)中经常负责处理卷积的大量计算,若出现硬件故障,则会导致计算错误,从而造成预测精度大幅下降.为了修复2D计算阵列中的故障,文章提出一种用于容错DLA的重计算结构(recomputing architecture,RCA),与传统的在阵列中添加冗余的即时故障修复策略不同,它具有一组基于冗余的重计算单元(recomputing unit,RCU),可以在稍后的周期中一对一地进行故障单元的重新计算.实验结果表明,与之前的容错方案相比,该文提出的方法显示出更高的故障修复能力和可扩展性,并且芯片面积占用更少.
重计算结构(RCA)、深度学习加速器(DLA)、容错、重计算
46
TP183(自动化基础理论)
国家自然科学基金61834006
2023-02-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
54-59