基于语音的置信度检测方法和系统

引用

摘要：

本公开所描述的技术涉及基于语音的置信度检测方法和系统。描述了一种用于训练置信度检测模型的方法包括：采集语音数据；基于该语音数据来提取多个特征参数集；获得与该语音数据相对应的置信度信息，该置信度信息指示在多个特征参数集中的每一个特征参数集下的置信度；将该语音数据的多个特征参数集中的每一者与该置信度信息进行关联以形成训练数据；以及基于该训练数据来训练置信度检测模型。本公开还描述了一种用于基于语音来检测置信度的方法包括：获得由上述用于训练置信度检测模型的方法来训练的置信度检测模型，获取语音数据，提取该语音数据的特征参数集，以及基于该语音数据的该特征参数集，使用该置信度检测模型来检测置信度。

专利类型：发明专利

申请/专利号：CN201910530494.7

申请日期：2019-06-19

公开/公告号：CN112116913A

公开/公告日：2020-12-22

主分类号：G10L17/26(2013.01)

申请/专利权人:宝马股份公司

发明/设计人:S·卡拉布伦;尤琪;何吉波

主申请人地址:德国慕尼黑

专利代理机构:上海专利商标事务所有限公司

代理人:唐杰敏%蔡悦

国别省市代码:德国;DE

权利要求：

1.一种用于训练置信度检测模型的方法，包括：采集语音数据；基于所述语音数据来提取多个特征参数集；获得与所述语音数据相对应的置信度信息，所述置信度信息指示在所述多个特征参数集中的每一个特征参数集下的置信度；将所述语音数据的所述多个特征参数集中的每一个特征参数集与所述置信度信息进行关联以形成训练数据；以及基于所述训练数据来训练置信度检测模型。 2.如权利要求1所述的方法，其特征在于，进一步包括对所述语音数据进行预处理，所述预处理包括对所述语音数据进行采样量化、分帧处理、以及根据语音强度来去除无声段。 3.如权利要求1所述的方法，其特征在于，进一步包括对所述语音数据进行预处理，所述预处理包括对所述语音数据执行硬件降噪、软件降噪、或其组合。 4.如权利要求3所述的方法，其特征在于，所述软件降噪包括采用快速傅里叶变换(FFT)算法来执行数字处理降噪。 5.如权利要求1所述的方法，其特征在于，所述训练包括使用支持向量机(SVM)、卷积神经网络(CNN)、随机森林(RF)算法来训练所述置信度检测模型。 6.如权利要求1所述的方法，其特征在于，所述多个特征参数集中的每一个特征参数集包括以下各项中的一者或多者：所述语音数据的能量、过零率、自相关系数、振幅、能熵比、反射系数、音调、共振频率、线性预测倒谱系数(LPCC)、光谱质心、梅尔频率倒谱系数(MFCC)。 7.如权利要求6所述的方法，其特征在于，所述LPCC是使用以下步骤来获得的：对线性预测系数(LPC)进行快速傅里叶变换(FFT)计算，以输出经FFT计算的LPC；对所述经FFT计算的LPC取对数运算；对所述对数运算的结果进行快速傅里叶反变换(IFFT)计算，以获得所述LPCC。 8.如权利要求6所述的方法，其特征在于，所述MFCC是使用以下步骤来获得的：将所述语音数据的频率划分成一系列三角形的Mel滤波器序列；取每个三角形的Mel滤波器序列频率带宽内所有信号幅度的加权和作为相应滤波器的输出；对所述滤波器的所有所述输出作对数运算；对所述对数运算的结果进行离散余弦变换(DCT)，以获得所述MFCC。 9.一种基于语音的置信度检测方法，包括：获得由根据权利要求1-8中的任一项所述的方法来训练的置信度检测模型；获取语音数据；提取所述语音数据的特征参数集；以及基于所述语音数据的所述特征参数集，使用所述置信度检测模型来检测置信度。 10.如权利要求9所述的方法，其特征在于，进一步包括：将所述语音数据的所述特征参数集输入所述置信度检测模型；输出置信度信息，其中所述置信度信息指示所述语音数据的所述特征参数集下的置信度。 11.如权利要求10所述的方法，其特征在于，所述方法被用于检测谎言，所述方法进一步包括：响应于所述置信度高于阈值而确定在获取所述语音数据时被检测人撒谎。 12.一种用于训练置信度检测模型的系统，包括：采集模块，其配置成采集语音数据；提取模块，其配置成基于所述语音数据来提取多个特征参数集；置信度信息获得模块，其配置成获得与所述语音数据相对应的置信度信息，其中所述置信度信息指示在所述多个特征参数集中的每一个特征参数集下的置信度；关联模块，其配置成将所述语音数据的所述多个特征参数集中的每一个特征参数集与所述置信度信息进行关联以形成训练数据；以及训练模块，其配置成基于所述训练数据来训练置信度检测模型。 13.一种基于语音的置信度检测系统，所述系统包括：模型获得模块，其配置成获得由根据权利要求1-8中的任一项所述的方法来训练的置信度检测模型；语音数据获取模块，其配置成获取语音数据；提取模块，其配置成提取所述语音数据的特征参数集；以及检测模块，其配置成基于所述语音数据的所述特征参数集，使用所述置信度检测模型来检测置信度。 14.如权利要求13所述的系统，其特征在于，进一步包括：输入模块，其配置成将所述语音数据的所述特征参数集输入所述置信度检测模型；输出模块，其配置成输出置信度信息，其中所述置信度信息指示所述语音数据的所述特征参数集下的置信度。 15.如权利要求14所述的系统，其特征在于，所述系统被用于检测谎言，所述系统进一步包括：确定模块，其配置成响应于所述置信度高于阈值而确定在获取所述语音数据时被检测人撒谎。

专利专题