基于人工智能的数据处理方法、装置、设备及介质

引用

摘要：

本发明涉及人工智能技术领域，尤其涉及一种基于人工智能的数据处理方法、装置、设备及存储介质。该基于人工智能的数据处理方法包括获取用户语音数据，并基于用户语音数据进行特征提取，获取用户声纹特征；获取采用用户声纹特征对多层神经网络进行训练所得到的原始识别模型以及对应的模型输出值；根据模型输出值，计算原始识别模型的当前损失值；根据当前损失值确定目标变化量；基于目标变化量，采用线性更新算法对线性单元进行更新，以及基于目标变化量，采用非线性更新算法对非线性单元进行更新，获取用户标识对应的目标识别模型。本发明还涉及区块链技术，用户语音数据存储于区块链中。本发明可有效提高模型更新的准确率。

专利类型：发明专利

申请/专利号：CN202011006315.9

申请日期：2020-09-23

公开/公告号：CN112116912A

公开/公告日：2020-12-22

主分类号：G10L17/02(2013.01)

申请/专利权人:平安国际智慧城市科技股份有限公司

发明/设计人:韩浩瀚

主申请人地址:518000 广东省深圳市前海深港合作区妈湾兴海大道3048号前海自贸大厦1-34层

专利代理机构:深圳国新南方知识产权代理有限公司

代理人:周雷

国别省市代码:广东;44

权利要求：

1.一种基于人工智能的数据处理方法，其特征在于，包括：获取携带用户标识的用户语音数据，对所述用户语音数据进行特征提取以得到用户声纹特征；采用所述用户声纹特征对多层神经网络进行训练，得到原始识别模型以及对应的模型输出值；其中，所述原始识别模型包括线性单元和非线性单元；根据所述模型输出值，计算所述原始识别模型的当前损失值；根据所述当前损失值确定目标变化量；基于所述目标变化量，采用线性更新算法对所述线性单元进行更新，以及基于所述目标变化量，采用非线性更新算法对所述非线性单元进行更新；重复执行所述基于所述目标变化量，采用线性更新算法对所述线性单元进行更新，以及基于所述目标变化量，采用非线性更新算法对所述非线性单元进行更新，直至达到所述模型的收敛条件，得到所述用户标识对应的目标识别模型。 2.如权利要求1所述基于人工智能的数据处理方法，其特征在于，所述基于所述用户语音数据进行特征提取，获取用户声纹特征，包括：对所述用户语音数据进行快速傅里叶变换，获取所述述用户语音数据对应的频谱；将所述频谱通过梅尔滤波器组进行滤波处理，以得到所述用户声纹特征。 3.如权利要求1所述基于人工智能的数据处理方法，其特征在于，所述基于所述目标变化量，采用线性更新算法对所述线性单元进行更新，包括：将所述线性单元中的当前参数变量的全微分值与所述全微分值的二级范数的平方的比值作为目标学习率；其中，所述当前参数变量为当前时刻线性单元所对应的参数变量；将所述目标变化量与所述目标学习率的乘积作为下一待更新线性单元的参数变量的目标更新量；其中，所述下一待更新线性单元为下一时刻待更新的线性单元；根据所述目标更新量对所述待更新线性单元进行更新。 4.如权利要求3所述基于人工智能的数据处理方法，其特征在于，在基于所述目标变化量，采用线性更新算法对所述线性单元进行更新的步骤之后，所述基于人工智能的数据处理方法还包括：根据所述待更新线性单元的参数变量的中的输入变量，计算中间变化量；将所述中间变化量赋值给所述目标变化量，以更新所述目标变化量。 5.如权利要求1所述基于人工智能的数据处理方法，其特征在于，所述非线性单元对应一非线性激活函数；所述基于所述目标变化量，采用非线性更新算法对所述非线性单元进行更新，包括：计算所述非线性激活函数在当前非线性单元处的第一微分值，并将所述第一微分值与所述第一微分值的平方的比值；将所述比值与所述目标变化量的乘积作为中间更新量；计算所述非线性激活函数在所述中间更新量处的第二微分值与所述第一微分值的差值的绝对值；计算所述绝对值与常数1的加和，并将所述常数1与所述加和的比值作为目标学习率；将所述目标学习率与所述中间更新量的乘积作为下一待更新非线性单元的目标更新量；根据所述目标更新量对所述待更新非线性单元进行更新。 6.如权利要求1所述基于人工智能的数据处理方法，其特征在于，在基于所述用户语音数据进行特征提取，获取用户声纹特征的步骤之前，所述基于人工智能的数据处理方法还包括：对所述用户语音数据进行分帧处理，获取至少一帧单帧语音数据；采用语音增强算法对至少一帧所述单帧语音数据进行增强处理，获取降噪后的用户语音数据。 7.如权利要求1所述基于人工智能的数据处理方法，其特征在于，在所述获取用户标识对应的目标识别模型的步骤之后，所述基于人工智能的数据处理方法还包括：响应身份验证请求，采集目标用户的待测语音数据；调用预先训练好的与所述目标用户对应的目标识别模型，对所述待测语音数据进识别，获取识别概率值；若所述识别概率值大于预设概率值，则获取身份验证通过的结果。 8.一种基于人工智能的数据处理装置，其特征在于，包括：特征提取模块，用于获取用户语音数据，并基于所述用户语音数据进行特征提取，获取用户声纹特征；模型训练模块，用于获取采用所述用户声纹特征对多层神经网络进行训练所得到的原始识别模型以及对应的模型输出值；其中，所述原始识别模型包括线性单元和非线性单元；损失计算模块，用于根据所述模型输出值，计算所述原始识别模型的当前损失值；目标变化量确定模块，用于根据所述当前损失值确定目标变化量；模型更新模块，用于基于所述目标变化量，采用线性更新算法对所述线性单元进行更新，以及基于所述目标变化量，采用非线性更新算法对所述非线性单元进行更新；模型获取模块，用于重复执行所述基于所述目标变化量，采用线性更新算法对所述线性单元进行更新，以及基于所述目标变化量，采用非线性更新算法对所述非线性单元进行更新的步骤，直至达到所述模型的收敛条件，获取所述用户标识对应的目标识别模型。 9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于人工智能的数据处理方法的步骤。 10.一种计算机存储介质，所述计算机存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于人工智能的数据处理方法的步骤。

专利专题