10.14001/j.issn.1002-4093.2022.03.009
基于频率通道注意力网络的花生图像识别
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进.首先,在每个残差结构中引入频率通道注意力(Frequency Channel Atten-tion,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;其次,通过可学习的自适应激活函数(Activate or Not,ACON)进行激活,动态地学习了激活函数的非线性程度,激活过程更加稳健而有效;最后,利用梯度集中(Gradient Centralization)的动量梯度下降算法优化损失函数.同等实验条件下对比VGG16、AlexNet和未改进的ResNet50模型,该模型性能最优,模型参数大小为127 MB,单张图耗时0.31 s,测试集上平均识别准确率为98%,高出模型改进前2.46个百分点.FAG-ResNet50模型可以很好地解决花生果分类问题,为智能花生果分级设备的开发奠定了技术基础.
图像识别、频率通道注意力、自适应激活函数、梯度集中、花生分级
51
TP391.41;S565.209.2(计算技术、计算机技术)
国家自然科学基金;重庆市自然科学基金;重庆市研究生科研创新项目
2022-09-27(万方平台首次上网日期,不代表论文的发表时间)
共9页
69-76,82