基于卷积神经网络的食品图像识别
目的 探究一种基于Inception_V3-CNN模型的食品图像识别和分类方法.方法 选取包含20类食品和19609张的食品图像建立数据集Food-101, 通过卷积神经网络(convolutional neural networks, CNN)提取图像候选区域的视觉特征, 并自动进行分类, 使其具有较高的识别率; 此外, 采集来自kaggle库中已标注的食品图像集做预测对比实验, 以保证Inception_V3-CNN模型检测的准确度.结果 该方法能够去除背景噪音, 且仅需部分提取视觉特征, 可以有效解决网络食品图像的分类问题, 与多视图支持向量机(support vector machine, SVM)+方向梯度直方图(histogram of oriented gradients, HOG)和传统CNN方法相比, 在测试时间相近、设备计算能力相同的条件下, 该方法识别率更高, 迭代次数为15000次时, Loss值降至4.92, 准确率可达93.89%.结论 此方法可以快速识别食品图像, 在实际网络图片中能有较好的可移植性.将算法移植到移动设备中实现APP的模块化操作也将成为后续工作探索的重点方向.
食品图像、图像检索、图像分类、Inception_V3-CNN、卷积神经网络
10
辽宁省高等学校产业技术研究院重大应用研究项目041804;辽宁省重点研发计划指导计划项目2017205003
2019-10-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
6241-6247