DOI：10.7652/xjtuxb201806006

基于Caffe的嵌入式多核处理器深度学习框架并行实现

引用

摘要：

针对开源深度学习快速特征嵌入的卷积框架(Caffe)在Android移动端进行前向计算时存在的兼容性和时间性能差的问题,提出了基于Caffe的嵌入式同构、异构并行化改进设计方法.该方法将Caffe及其第三方库通过交叉编译移植到嵌入式移动平台后,利用同构的多核多线程方法分别对卷积层、输入帧之间的部分前向计算过程进行了并行化;实现了采用开放运算语言(OpenCL)的异构图形处理器(GPU)卷积计算,进一步提升了框架的处理速度.对3种经典的深度神经网络模型MNIST、Cifar-10和CaffeNet进行了测试对比,测试结果表明:在没有任何模型精度损失的条件下,并行后的前向计算耗时明显低于并行前,时间性能提升最高达到2倍.所提方法能够将深度学习框架Caffe高效地、并行地部署和应用于嵌入式移动多核芯片上.

关键词：深度学习、移动端、前向计算、并行、OpenCL

所属期刊栏目：52

分类号：TP183(自动化基础理论)

资助基金：国家重点研发计划资助项目2017YFB1301100

在线出版日期：2018-07-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：36-41,113

英文信息展示

期刊专题