融合通道层注意力机制的多支路卷积网络抑郁症识别

引用

摘要：

目的抑郁症是一种常见的情感性精神障碍,会带来诸多情绪和身体问题.在实践中,临床医生主要通过面对面访谈并结合自身经验评估抑郁症的严重程度.这种诊断方式具有较强的主观性,整个过程比较耗时,且易造成误诊、漏诊.为了客观便捷地评估抑郁症的严重程度,本文围绕面部图像研究深度特征提取及其在抑郁症自动识别中的应用,基于人脸图像的全局和局部特征,构建一种融合通道层注意力机制的多支路卷积网络模型,进行抑郁症严重程度的自动识别.方法首先从原始视频提取图像,使用多任务级联卷积神经网络检测人脸关键点.在对齐后分别裁剪出整幅人脸图像和眼睛、嘴部区域图像,然后将它们分别送入与通道层注意力机制结合的深度卷积神经网络以提取全局特征和局部特征.在训练时,将训练图像进行标准化预处理,并通过翻转、裁剪等操作增强数据.在特征融合层将3个支路网络提取的特征拼接在一起,最后输出抑郁症严重程度的分值.结果在AVEC2013(The Continuous Audio/Visual Emotion and Depression Recognition Challenge)抑郁症数据库上平均绝对误差为6.74、均方根误差为8.70,相较于Baseline分别降低4.14和4.91;在AVEC2014抑郁症数据库上平均绝对误差和均方根误差分别为6.56和8.56,相较于Baseline分别降低2.30和2.30.同时,相较于其他抑郁症识别方法,本文方法取得了最低的平均绝对误差和均方根误差.结论本文方法能够以端到端的形式实现抑郁症的自动识别,将特征提取和抑郁症严重程度识别在统一框架下进行和调优,学习到的多种视觉特征更加具有鉴别性,实验结果表明了该算法的有效性和可行性.

关键词：抑郁症识别、通道层注意力机制、深度卷积神经网络、特征融合、空间权重

所属期刊栏目：27

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金;国家自然科学基金;北京市优秀人才资助项目;江苏省重点研发项目

在线出版日期：2022-11-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：3292-3302

英文信息展示

期刊专题