复合时空特征的双模态情感识别

引用

摘要：

目的针对体积局部二值模式应用到视频帧特征提取上,特征维数大,对光照及噪声鲁棒性差等问题,提出一种新的特征描述算法一时空局部三值模式矩(TSLTPM).考虑到TSLTPM描述的仅是纹理特征,本文进一步融合3维梯度方向直方图(3DHOG)特征来增强对情感视频的描述.方法首先对情感视频进行预处理获得表情和姿态序列;然后对表情和姿态序列分别提取TSLTPM和3DHOG特征,计算测试序列与已标记的情感训练集特征间的最小欧氏距离,并将其作为独立证据来构造基本概率分配;最后使用D-S证据联合规则得到情感识别结果.结果在FABO数据库上进行实验,表情和姿态单模态分别取得83.06％和94.78％的平均识别率,在表情上分别比VLBP(体积局部二值模式)、LBP-TOP(三正交平面局部二值模式)、TSLTPM、3DHOG高9.27％、12.89％、1.87％、1.13％;在姿态上分别比VLBP、LBP-TOP、TSLTPM、3DHOG高24.61％、27.55％、1.18％、0.98％.将两种模态进行融合以后平均识别率达到96.86％,说明了融合表情和姿态进行情感识别的有效性.结论本文提出的TSLTPM特征将VLBP扩展成时空三值模式,能够有效降低维数,减少光照和噪声对识别的影响,与3DHOG特征形成复合时空特征有效增强了情感视频的分类性能,与典型特征提取算法的对比实验也表明了本文算法的有效性.另外,与其他方法的对比实验也验证了本文融合方法的优越性.

关键词：表情、姿态、时空局部三值模式矩、3维方向梯度直方图、Dempster-Shafer证据理论

所属期刊栏目：22

分类号：TP181;TP301.6(自动化基础理论)

资助基金：国家自然科学基金项目61300119,61432004;安徽省自然科学基金项目1408085MKL16National Natural Science Foundation of China61300119,61432004

在线出版日期：2017-02-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：39-48

英文信息展示

期刊专题