混合深度网络在场景识别技术中的应用

引用

摘要：

场景识别是计算机视觉领域重要的研究方向,场景图片的类间相似性和类内差异性使得场景识别极具挑战性.提出一种混合深度场景识别方法,该模型首先在混合识别的Fisher编码层和判别层之前用深度直连自编码器作为图像局部特征提取层,完善了整个混合深度识别框架.采用直连非监督深度网络输出直接重构输入,能够提取更有判别性的中尺度局部特征.本文还在Fisher编码层引入金字塔空间信息,考虑局部特征空间分布.此外,通过改变场景图片对应局部图像块的构成实现场景数据扩充.引入图片所在类中出现概率低的图像决作为类内干扰加入原图像块中,减少类内差异误判.为了减少类间相似性影响,通过信息熵度量保留图片的类间相似的图像块,引入相似类中特有的关键图像块,替换原先类别相关的图像决,同时改变对应标签,突出关键图像块对相似类别判断的决定性.在scene15数据集上的实验表明本文方法可以有效提高场景识别的准确率.

关键词：场景识别、混合深度结构、直连卷积自编码、金字塔Fisher编码、数据扩充

所属期刊栏目：38

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学青年基金项目61601230;江苏省自然科学基金青年基金项目BK20141004资助:江苏省普通高校自然科学研究项目11KJB510009,14KJB510019;江苏高校优势学科Ⅱ期建设工程项目资助;江苏省大学生实践创新训练计划项目201510300036Z

在线出版日期：2017-08-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：1387-1393

英文信息展示

期刊专题