复杂背景下的手势识别

引用

摘要：

目的手势识别是人机交互领域的热点问题.针对传统手势识别方法在复杂背景下识别率低,以及现有基于深度学习的手势识别方法检测时间长等问题,提出了一种基于改进TinyYOLOv3算法的手势识别方法.方法对TinyYOLOv3主干网络重新进行设计,增加网络层数,从而确保网络提取到更丰富的语义信息.使用深度可分离卷积代替传统卷积,并对不同网络层的特征进行融合,在保证识别准确率的同时,减小网络模型的大小.采用CIoU(complete intersection over union)损失对原始的边界框坐标预测损失进行改进,将通道注意力模块融合到特征提取网络中,提高了定位精度和识别准确率.使用数据增强方法避免训练过拟合,并通过超参数优化和先验框聚类等方法加快网络收敛速度.结果改进后的网络识别准确率达到99.1％,网络模型大小为27.6 MB,相比原网络(TinyYOLOv3)准确率提升了8.5％,网络模型降低了5.6 MB,相比于YOLO (you only look once)v3和SSD(single shot multibox detector)300算法,准确率略有降低,但网络模型分别减小到原来的1/8和1/3左右,相比于YOLO-lite和MobileNet-SSD等轻量级网络,准确率分别提升61.12％和3.11％.同时在自制的复杂背景下的手势数据集对改进后的网络模型进行验证,准确率达到97.3％,充分证明了本文算法的可行性.结论本文提出的改进Tiny-YOLOv3手势识别方法,对于复杂背景下的手势具有较高的识别准确率,同时在检测速度和模型大小方面都优于其他算法,可以较好地满足在嵌入式设备中的使用要求.

关键词：手势识别、TinyYOLOv3、深度可分离卷积、CIoU损失

所属期刊栏目：26

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目;山西省科技成果转化引导专项项目;山西省重点研发计划项目;山西省研究生教育创新项目

在线出版日期：2021-05-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：815-827

英文信息展示

期刊专题