语音识别结果的校准方法、装置、设备及存储介质

引用

摘要：

本案涉及人工智能，提供一种语音识别结果的校准方法、装置、设备及存储介质，用于解决将语音转化为文字时文字错误识别率高的问题。语音识别结果的校准方法包括：获取多条目标语音，将多条目标语音转化为多条初始语句；通过模糊匹配算法筛选目标语句中的多个关键词，根据转化阈值将多个关键词替换为多个基础标准词，得到第一校准语句；根据上文语句中的其他标准词，对第一校准语句进行匹配校准，得到第二校准语句；采用相似度算法计算第一校准语句的第一意图匹配度及第二校准语句的第二意图匹配度；若第二意图匹配度大于第一意图匹配度，且第二意图匹配度的数值大于匹配阈值，则将第二校准语句确定为输出语句，否则将第一校准语句确定为输出语句。

专利类型：发明专利

申请/专利号：CN202010581203.X

申请日期：2020-06-23

公开/公告号：CN111696557A

公开/公告日：2020-09-22

主分类号：G10L15/26(2006.01)

申请/专利权人:深圳壹账通智能科技有限公司

发明/设计人:王振华

主申请人地址:518052 广东省深圳市前海深港合作区前湾一路A栋201室

专利代理机构:北京市京大律师事务所

代理人:刘挽澜

国别省市代码:广东;44

权利要求：

1.一种语音识别结果的校准方法，其特征在于，所述语音识别结果的校准方法包括：基于语音识别算法获取多条目标语音，并将所述多条目标语音转化为文字，得到多条初始语句；通过模糊匹配算法筛选目标语句中的多个关键词，并根据转化阈值将所述多个关键词替换为多个基础标准词，得到第一校准语句，其中，所述目标语句为所述多条初始语句中的任意一条初始语句，所述基础标准词是业务数据中的常用词；根据上文语句中的其他标准词，对所述第一校准语句进行匹配校准，得到第二校准语句，其中，所述上文语句为所述第一校准语句的前一条语句，所述其他标准词为所述业务数据中除所述基础标准词之外的常用词；采用相似度算法分别计算所述第一校准语句的第一意图匹配度以及所述第二校准语句的第二意图匹配度；若所述第二意图匹配度大于所述第一意图匹配度，且所述第二意图匹配度的数值大于匹配阈值，则将所述第二校准语句确定为输出语句，否则将所述第一校准语句确定为输出语句。 2.根据权利要求1所述的语音识别结果的校准方法，其特征在于，所述基于语音识别算法获取多条目标语音，并将所述多条目标语音转化为文字，得到多条初始语句包括：基于语音识别算法获取多条目标语音，并提取所述多条目标语音中的语音特征；通过预设的声学模型将所述语音特征转化为音素信息，其中，所述音素信息用于指示构成音节的最小语音单位；利用所述音素信息匹配对应的文字信息，得到多条初始语句。 3.根据权利要求2所述的语音识别结果的校准方法，其特征在于，所述利用所述音素信息匹配对应的文字信息，得到多条初始语句包括：在预置字典中匹配与所述音素信息相对应的文字信息，其中，所述文字信息包括单个文字或词语；在预置关联概率中获取所述文字信息的关联概率，并提取出关联概率最大的文字信息作为目标文字，其中，所述预置关联概率用于指示任意两个单个文字或词语之间相互关联的概率；按照排列顺序将所述目标文字组合在一起，得到多条初始语句，其中，所述多条初始语句的数量与所述多条目标语音的数量相同。 4.根据权利要求1所述的语音识别结果的校准方法，其特征在于，所述通过模糊匹配算法筛选目标语句中的多个关键词，并根据转化阈值将所述多个关键词替换为多个基础标准词，得到第一校准语句包括：通过模糊匹配算法将目标语句转化为拼音语句；筛选出所述拼音语句中的目标音标，并将所述目标音标转化为近音音标，得到转化拼音语句，其中，所述目标音标包括具有易混淆的韵母和/或声母；提取出所述转化拼音语句中多个带有近音音标的关键词，并计算所述关键词与对应的基础标准词之间的相似度，其中，所述基础标准词是业务数据中的常用词；当目标相似度的数值大于替换阈值时，将目标相似度对应的关键词替换为对应的基础标准词，得到第一校准语句。 5.根据权利要求1所述的语音识别结果的校准方法，其特征在于，所述根据上文语句中的其他标准词，对所述第一校准语句进行匹配校准，得到第二校准语句包括：判断所述第一校准语句的上文语句中是否包括其他标准词；若所述上文语句中包括所述其他标准词，则判断所述第一校准语句中是否包括与所述其他标准词对应的性质相近的关键词，其中，所述性质相近的关键词包括近义关键词以及同音关键词；若所述第一校准语句中包括所述性质相近的关键词，则将所述性质相近的关键词替换为对应的其他标准词，得到第二校准语句。 6.根据权利要求5所述的语音识别结果的校准方法，其特征在于，所述若所述上文语句中包括所述其他标准词，则判断所述第一校准语句中是否包括与所述其他标准词对应的性质相近的关键词包括：若所述上文语句中包括所述其他标准词，则计算所述其他标准词与所述第一校准语句之间的多个意图相似度；基于第一预置算法以及目标意图相似度判断所述第一校准语句中是否包括近义关键词；若所述第一校准语句中不包括所述近义关键词，则将所述第一校准语句转化为校准拼音语句，并计算所述校准拼音语句与所述其他标准词的拼音之间的多个拼音相似度；基于第二预置算法以及目标拼音相似度判断所述校准拼音语句中是否包括同音关键词。 7.根据权利要求6所述的语音识别结果的校准方法，其特征在于，所述采用相似度算法分别计算所述第一校准语句的第一意图匹配度以及所述第二校准语句的第二意图匹配度包括：提取所述第一校准语句中的基础标准词；采用相似度算法计算所述基础标准词与所述第一校准语句之间的第一意图匹配度，其中，所述第一意图匹配度用于指示所述预置关键词符合所述第一校准语句表达含义的匹配值；提取所述第二校准语句中的其他标准词；采用所述相似度算法计算所述其他标准词与所述第二校准语句之间的第二意图匹配度。 8.一种语音识别结果的校准装置，其特征在于，所述语音识别结果的校准装置包括：获取及转化模块，用于基于语音识别算法获取多条目标语音，并将所述多条目标语音转化为文字，得到多条初始语句；筛选及替换模块，用于通过模糊匹配算法筛选目标语句中的多个关键词，并根据转化阈值将所述多个关键词替换为多个基础标准词，得到第一校准语句，其中，所述目标语句为所述多条初始语句中的任意一条初始语句，所述基础标准词是业务数据中的常用词；校准模块，用于根据上文语句中的其他标准词，对所述第一校准语句进行匹配校准，得到第二校准语句，其中，所述上文语句为所述第一校准语句的前一条语句，所述其他标准词为所述业务数据中除所述基础标准词之外的常用词；计算模块，用于采用相似度算法分别计算所述第一校准语句的第一意图匹配度以及所述第二校准语句的第二意图匹配度；输出模块，若所述第二意图匹配度大于所述第一意图匹配度，且所述第二意图匹配度的数值大于匹配阈值，则用于将所述第二校准语句确定为输出语句，否则将所述第一校准语句确定为输出语句。 9.一种语音识别结果的校准设备，其特征在于，所述语音识别结果的校准设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述语音识别结果的校准设备执行如权利要求1-7中任意一项所述的语音识别结果的校准方法。 10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述语音识别结果的校准方法。

专利专题