DOI：10.11834/jig.20160308

并行交叉的深度卷积神经网络模型

引用

摘要：

目的图像分类与识别是计算机视觉领域的经典问题,是图像检索、目标识别及视频分析理解等技术的基础.目前,基于深度卷积神经网络(CNN)的模型已经在该领域取得了重大突破,其效果远远超过了传统的基于手工特征的模型.但很多深度模型神经元和参数规模巨大,训练困难.为此根据深度CNN模型和人眼视觉原理,提出并设计了一种深度并行交叉CNN模型(PCCNN模型).方法该模型在Alex-Net基础上,通过两条深度CNN数据变换流,提取两组深度CNN特征;在模型顶端,经过两次混合交叉,得到1 024维的图像特征向量,最后使用Softmax回归对图像进行分类识别.结果与同类模型相比,该模型所提取的特征更具判别力,具有更好的分类识别性能;在Caltech101上top1识别精度达到63％左右,比VGG16高出近5％,比GoogLeNet高出近10％;在Caltech256上topl识别精度达到46％以上,比VGG16高出近5％,比GoogLeNet高出2.6％.结论 PCCNN模型用于图像分类与识别效果显著,在中等规模的数据集上具有比同类其他模型更好的性能,在大规模数据集上其性能有待于进一步验证;该模型也为其他深度CNN模型的设计提供了一种新的思路,即在控制深度的同时,提取更多的特征信息,提高深度模型性能.

关键词：图像分类、识别、深度CNN、Alex-Net、并行交叉国、人眼视觉

所属期刊栏目：21

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金项目61472281;上海市曙光计划12SG23 National Natural Science Foundation of China61472281

在线出版日期：2016-04-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：339-347

英文信息展示

期刊专题