10.19678/j.issn.1000-3428.0051507
基于矩阵转换的卷积计算优化方法
提出一种基于矩阵转换的高效卷积计算优化方法MCFA.根据输出矩阵的宽度和卷积核大小对输入矩阵进行分块,通过im2col方法转换输入矩阵子块和核函数矩阵,利用计算统一设备架构中封装的矩阵-矩阵乘法加速库提升卷积计算的速度.在此基础上,将输出子块按序排列,最终得到完整的输出矩阵.实验结果证明,该方法相比im2col方法能节省61.25%的计算空间,相比MEC方法能提高20.57%的计算速度,且在分块情况下可以缓解大输入矩阵引起的缓存压力,提高缓存利用率.
深度学习、卷积计算、直接卷积、矩阵分块、计算统一设备架构、卷积优化
45
TP391(计算技术、计算机技术)
国家自然科学基金61572325,60970012;高等学校博士学科点专项科研博导基金20113120110008;上海重点科技攻关项目14511107902,16DZ1203603;上海市工程中心建设项目GCZX14014;上海智能家居大规模物联共性技术工程中心项目GCZX14014;上海市一流学科建设项目XTKX2012;沪江基金研究基地专项C14001
2019-08-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
217-221,228