并行交叉的深度卷积神经网络模型
目的 图像分类与识别是计算机视觉领域的经典问题,是图像检索、目标识别及视频分析理解等技术的基础.目前,基于深度卷积神经网络(CNN)的模型已经在该领域取得了重大突破,其效果远远超过了传统的基于手工特征的模型.但很多深度模型神经元和参数规模巨大,训练困难.为此根据深度CNN模型和人眼视觉原理,提出并设计了一种深度并行交叉CNN模型(PCCNN模型).方法 该模型在Alex-Net基础上,通过两条深度CNN数据变换流,提取两组深度CNN特征;在模型顶端,经过两次混合交叉,得到1 024维的图像特征向量,最后使用Softmax回归对图像进行分类识别.结果 与同类模型相比,该模型所提取的特征更具判别力,具有更好的分类识别性能;在Caltech101上top1识别精度达到63%左右,比VGG16高出近5%,比GoogLeNet高出近10%;在Caltech256上topl识别精度达到46%以上,比VGG16高出近5%,比GoogLeNet高出2.6%.结论 PCCNN模型用于图像分类与识别效果显著,在中等规模的数据集上具有比同类其他模型更好的性能,在大规模数据集上其性能有待于进一步验证;该模型也为其他深度CNN模型的设计提供了一种新的思路,即在控制深度的同时,提取更多的特征信息,提高深度模型性能.
图像分类、识别、深度CNN、Alex-Net、并行交叉国、人眼视觉
21
TP391.4(计算技术、计算机技术)
国家自然科学基金项目61472281;上海市曙光计划12SG23 National Natural Science Foundation of China61472281
2016-04-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
339-347