一种基于机载设备的特定说话人启动人脸识别方法

引用

摘要：

本发明公开了一种基于机载设备的特定说话人启动人脸识别方法，主要包括以下步骤：A、采集特定飞行员语音数据与其他说话人的孤立词条语音数据；B、采用端点检测、预加重、分帧加窗等语音数据前端处理；C、提取12维MFCC特征向量；D、设计并训练特定飞行员语音模型和语音内容识别模型；E、将测试语音数据的MFCC特征信息送入到特定飞行员语音识别模型与语音内容识别模型进行计算打分；F、识别出特定人与语音内容后启动人脸识别设备。本发明基于机载设备的特定说话人启动人脸识别方法通过特定人语音身份识别方法与人脸识别方法，极大的提高特定人的身份确认。

专利类型：发明专利

申请/专利号：CN201911251982.0

申请日期：2019-12-09

公开/公告号：CN113035173A

公开/公告日：2021-06-25

主分类号：G10L15/02(2006.01)

申请/专利权人:上海航空电器有限公司

发明/设计人:吴云清;李曜;吴沛文

主申请人地址:201101 上海市闵行区中春路6629号

专利代理机构:上海世圆知识产权代理有限公司

代理人:顾俊超

国别省市代码:上海;31

权利要求：

1.一种基于机载设备的特定说话人启动人脸识别方法，其特征在于，包含有以下步骤，步骤S1，采集特定飞行员语音数据与其他说话人的孤立词条语音数据；步骤S2，采用端点检测、预加重、分帧加窗语音数据前端处理；步骤S3，提取12维MFCC特征向量；步骤S4，设计并训练特定飞行员语音模型和语音内容识别模型；步骤S5，将测试语音数据的MFCC特征信息送入到特定飞行员语音识别模型与语音内容识别模型进行计算打分；以及，步骤S6，识别出特定人与语音内容后启动人脸识别设备。 2.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法，其特征在于，所述步骤S1中采集数据集操作方法，包含有，步骤S11，室内环境下采集N名待实验飞行员语音数据，语音内容至少有：启动身份认证，确认及飞行控制相关指令，N为大于1的整数；步骤S12，室内环境下采集其他说话人的语音数据，语音内容与步骤S11相同；步骤S13，在空中飞行环境中采集带有噪音的语音数据集，语音内容与步骤S11相同。 3.根据权利要求2所述的一种基于机载设备的特定说话人启动人脸识别方法，其特征在于，所述采集数据集必须包括模拟飞行环境和室内环境下的语音数据，且占比不低于0.2。 4.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法，其特征在于，所述步骤S3中MFCC特征提取的方法，包含有，步骤S31，经端点检测、预加重、分帧和加窗操作后，使用基为2的FFT算法对每一帧语音进行快速傅里叶变换；步骤S32，计算实部和虚部得到平方和后，然后采用可消除谐波作用的三角窗滤波器得到输出能量；步骤S33，人耳感受到的音调与声音的频率成对数关系，计算各个滤波器组输出的对数能量；步骤S34，经离散余弦变换（DCT）得到12维的MFCC特征信息，并在语音特征中加入其一阶差分倒谱和二阶差分倒谱。 5.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法，其特征在于，所述步骤S4中设计特定飞行员语音模型和语音内容模型的方法，包含有，步骤S41，利用其他说话人和飞行员的语音数据集训练可用于语音内容识别的隐马尔科夫模型；步骤S42，利用特定飞行员的语音数据集设计并训练N个待测特定飞行员的GMM-UBM语音模型，其中步骤S41训练的语音内容识别模型充当GMM-UBM中的UBM；步骤S43，利用特征语音自适应技术，并结合步骤S41、S42可实现特定飞行员身份与语音内容的同时识别。 6.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法，其特征在于，所述步骤S5中识别出特定人与语音内容后启动人脸识别设备的方法，包含有，步骤S51，识别出特定人信息和语音内容是启动身份认证后，自动打开摄像头开始人脸识别，进行2次身份认证；步骤S52，拍摄待测飞行员的头像，并提取头像特征；步骤S53，启动已训练好的人脸识别模型进行人脸比对，确认是否为该飞行员；步骤S54，是，则可以发动引擎；否，则无法启动飞行器引擎。

专利专题