10.3969/j.issn.1009-6868.2017.04.002
基于3D CNN的大规模视频手势识别研究
提出了一种基于三维卷积神经网络(CNN)的大规模视频手势识别算法.首先,为了获得统一尺度的输入数据,在时域上对所有输入视频进行了归一化处理得到32帧的输入视频;然后,为了从不同的角度描述手势特征,通过真彩(RGB)视频数据生成了光流视频,并将RGB视频和光流视频分别通过C3D模型(一个3D CNN模型)提取特征,并通过特征连接的方式加以融合输入到支持向量机(SVM)分类器来提高识别性能.该方法在Chalearn LAP独立手势数据集(IsoGD)的验证集上达到了46.70%的准确率.
手势识别、三维卷积神经网络、光流、SVM
23
TN929.5
国家自然科学基金61472302、U1404620、61672409;模式识别国家重点实验室开放课题基金资助201600031;中央高校基本科研业务费专项资金JB150317;陕西省自然科学基金2010JM8027;航空科学基金2015ZC31005
2017-08-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
9-13