一种语音识别方法、装置和电子设备

引用

摘要：

本发明实施例提供了一种语音识别方法、装置和电子设备，其中，所述方法包括：获取待识别语音数据；依据识别模型对所述待识别语音数据进行识别，得到所述待识别语音数据对应的语音识别文本；其中，所述识别模型包括通用识别模型和与所述通用识别模型并联的专用识别模型，所述专用识别模型依据指定领域的语料训练；由于用于训练专用识别模型的语料远小于重新训练通用识别模型的语料，进而能够实现快速的模型训练；且专用识别模型是依据指定领域的语料训练，其针对指定领域的语音数据进行识别的准确率更高；从而本发明实施例能够实现快速提高语音识别效果。

专利类型：发明专利

申请/专利号：CN201910218940.0

申请日期：2019-03-21

公开/公告号：CN111739535A

公开/公告日：2020-10-02

主分类号：G10L15/26(2006.01)

申请/专利权人:北京搜狗科技发展有限公司

发明/设计人:冷永才

主申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

专利代理机构:北京润泽恒知识产权代理有限公司

代理人:莎日娜

国别省市代码:北京;11

权利要求：

1.一种语音识别方法，其特征在于，包括：获取待识别语音数据；依据识别模型对所述待识别语音数据进行识别，得到所述待识别语音数据对应的语音识别文本；其中，所述识别模型包括通用识别模型和与所述通用识别模型并联的专用识别模型，所述专用识别模型依据指定领域的语料训练。 2.根据权利要求1所述的方法，其特征在于，所述依据识别模型对所述待识别语音数据进行识别，得到语音识别文本，包括：依据专用识别模型对所述待识别语音数据进行识别，得到第一文本信息；以及依据所述通用识别模型对所述待识别语音数据进行识别，得到第二文本信息；依据所述第一文本信息和第二文本信息，确定所述待识别语音数据对应的语音识别文本。 3.根据权利要求2所述的方法，其特征在于，所述第一文本信息包括第一识别文本和所述第一识别文本对应的第一概率信息，所述第二文本信息包括第二识别文本和所述第二识别文本对应的第二概率信息；所述依据所述第一识别文本和第二识别文本，确定所述待识别语音数据对应的语音识别文本，包括：比较所述第一概率信息和第二概率信息；若所述第一概率信息大于第二概率信息，则将所述第一识别文本作为所述待识别语音数据对应的语音识别文本；若所述第一概率信息小于第二概率信息，则将所述第二识别文本作为所述待识别语音数据对应的语音识别文本；若所述第一概率信息等于第二概率信息，则将所述第一识别文本或所述第二识别文本作为所述待识别语音数据对应的语音识别文本。 4.根据权利要求2所述的方法，其特征在于，所述通用识别模型和专用识别模型为语言模型，所述识别模型还包括声学模型，所述依据识别模型对所述待识别语音数据进行识别，得到对应的语音识别文本，还包括：将所述待识别语音数据输入至所述声学模型中得到语音转换文本信息，并将所述语音转换文本信息分别输入至所述通用识别模型和专用识别模型中；所述依据专用识别模型对所述待识别语音数据进行识别，得到第一文本信息，包括：采用所述专用识别模型对所述语音转换文本信息进行自然语音处理，得到第一文本信息；所述依据所述通用识别模型对所述待识别语音数据进行识别，得到第二文本信息，包括：采用所述通用识别模型对所述语音转换文本信息进行自然语音处理，得到第二文本信息。 5.根据权利要求1所述的方法，其特征在于，所述的方法还包括训练所述专用识别模型的步骤：收集所述指定领域的语料；对所述语料进行分词处理，得到所述语料对应的关键词；所述专用识别模型依据所述语料，确定每个关键词与其他关键词组合的概率信息。 6.根据权利要求1-5任一所述的方法，其特征在于，所述的语音识别方法应用于所述指定领域的同传场景。 7.一种语音识别装置，其特征在于，包括：数据获取模块，用于获取待识别语音数据；语音识别模块，用于依据识别模型对所述待识别语音数据进行识别，得到所述待识别语音数据对应的语音识别文本；其中，所述识别模型包括通用识别模型和与所述通用识别模型并联的专用识别模型，所述专用识别模型依据指定领域的语料训练。 8.根据权利要求7所述的装置，其特征在于，所述语音识别模块包括：第一识别子模块，用于依据通用识别模型对所述待识别语音数据进行识别，得到第一文本信息；第二识别子模块，用于依据所述专用识别模型对所述待识别语音数据进行识别，得到第二文本信息；文本确定子模块，用于依据所述第一文本信息和第二文本信息，确定所述待识别语音数据对应的语音识别文本。 9.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如方法权利要求1-6任一所述的语音识别方法。 10.一种电子设备，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：获取待识别语音数据；依据识别模型对所述待识别语音数据进行识别，得到所述待识别语音数据对应的语音识别文本；其中，所述识别模型包括通用识别模型和与所述通用识别模型并联的专用识别模型，所述专用识别模型依据指定领域的语料训练。

专利专题