DOI：10.3969/j.issn.1009-6868.2017.04.002

基于3D CNN的大规模视频手势识别研究

引用

摘要：

提出了一种基于三维卷积神经网络(CNN)的大规模视频手势识别算法.首先,为了获得统一尺度的输入数据,在时域上对所有输入视频进行了归一化处理得到32帧的输入视频;然后,为了从不同的角度描述手势特征,通过真彩(RGB)视频数据生成了光流视频,并将RGB视频和光流视频分别通过C3D模型(一个3D CNN模型)提取特征,并通过特征连接的方式加以融合输入到支持向量机(SVM)分类器来提高识别性能.该方法在Chalearn LAP独立手势数据集(IsoGD)的验证集上达到了46.70%的准确率.

关键词：手势识别、三维卷积神经网络、光流、SVM

所属期刊栏目：23

分类号：TN929.5

资助基金：国家自然科学基金61472302、U1404620、61672409;模式识别国家重点实验室开放课题基金资助201600031;中央高校基本科研业务费专项资金JB150317;陕西省自然科学基金2010JM8027;航空科学基金2015ZC31005

在线出版日期：2017-08-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：9-13

英文信息展示

期刊专题