一种基于Bottleneck Transformer的轻量级微表情识别架构
微表情是一种能够体现人真实情感的自发面部动作,其持续时间较短,动作幅度轻微,识别难度较大,但是有重要的研究价值.为解决微表情情感识别问题,提出了一种新型的轻量级微表情识别网络mini-AORCNN.该神经网络以顶点-起始点光流特征为输入,结合残差卷积神经网络与视觉Transformer的相关架构,可以有效完成微表情识别任务.这一网络包含一种参数量更小的新型残差模块,并用自注意力算子替换了最后一个残差块中的卷积算子,从而实现了Bottleneck Transformer架构.这一新型微表情识别网络在中科院CASME系列数据集上经过"留一被试交叉验证"(LOSO)的检验,确定其在情感分类任务上取得了73.09%的平均召回率(UAR)以及72.25%的平均F1-Score(UF1),上述准确率评价指标与极低的参数量(39185)在与微表情领域的多种主流模型的比较中体现出了明显的优势.文中还包含了一组消融实验,确保了光学应变强度、自注意力机制和相对位置编码等设计的优越性.
微表情识别、视觉Transformer、自注意力机制、残差卷积神经网络、可计算情感
49
TP301.6(计算技术、计算机技术)
德科学中心项目;上海市科技计划项目;中央高校基本科研业务费专项
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
370-377